• Intel® Graphics Performance Analyzers 2020 R1
  • 12/20/2019
  • Public Content
Contents

针对桌面 API 图形应用程序的系统分析

分析和优化的“自上而下”方法建议首先确定问题是在 CPU 还是在 GPU。在此最高层次了解您的性能问题是极为重要的。否则您可能会花费大量的时间优化游戏某些部分,而这些部分相对更重要的性能问题而言是次要的。
提示
一个好的经验法则是在 CPU 和 GPU 资源中达成一个平衡 - 不要让 CPU 以 100% 运行,而仅利用 GPU 的 20%,反之亦然。
要了解您的应用程序是否被占用大量 CPU 资源还是 GPU 绑定,您可以使用 System Analyzer HUD 或 System Analyzer 主机/目标模式中运行。
System Analyzer 对比 System Analyzer Heads-up Display (HUD)
游戏运行时,System Analyzer HUD 在后台工作,在游戏中叠加显示结果,从而可以快速了解游戏的性能情况并使用快捷键对游戏进行实验。
一般来说,System Analyzer 相对 System Analyzer HUD 而言具有以下优点:
  • 使用主机/目标(网络)模式,可以在远程系统上监控性能,从而减少对应用程序的性能影响。建议您以网络模式使用 System Analyzer,以分析 Ultrabook™ 设备、平板电脑、上网本,或其他资源有限的设备的图形应用程序。
  • 提供更详细的指标解析,可以同时查看四个以上指标,同时还可以选择计数器集和多个其他选项。使用 System Analyzer,可以在同一张图表中显示大量度量单位相同的指标(数量不限),对这些指标进行比较、在指标之间轻松切换,并调整指标图以更好地进行分析。
如果您在 System Analyzer HUD 启用的情况下将 System Analyzer 连接到应用程序,HUD 将切换到轻量级模式,仅显示 FPS。
备注
一些游戏和应用程序限制所有按键,因此键盘快捷键在 Intel® GPA 中不起作用。在这种情况下,要创建帧/踪迹捕获文件,可以:
  • 使用 System Analyzer 的
    Capture Frame
    /
    Capture Trace
    按钮。
  • 在 Graphics Monitor 中设置触发器,以在某些特定条件发生时(例如当 FPS 是 20 时)自动创建帧/踪迹捕获文件。
系统分析工作流程
要了解应用程序是 CPU 密集型,还是 GPU 密集型,请按照以下典型的工作流程操作:
1.
双击任务栏通知区域中的 Graphics Monitor 图标 ,并在
Graphics Monitor Launcher
屏幕中选择要运行的应用程序。这将以 System Analyzer HUD 运行游戏,使您能快速分析性能数据、以覆盖模式进行实验并捕获帧和踪迹文件。
2.
启动 System Analyzer 并将其连接到正在运行的应用程序,快速分析其性能并捕获帧/踪迹文件。您可以在本地和网络使用模式之间进行选择。
默认情况下,System Analyzer 在 System View 模式下启动。该模式下会显示常规的系统指标。从 Graphics Monitor 启动应用程序后,即可点击
Connect System Analyzer
按钮打开 System Analyzer,然后将其连接到应用程序。
备注
建议您以网络模式使用 System Analyzer,以分析 Ultrabook™ 设备、平板电脑、上网本或其他资源有限的设备的图形应用程序。
3.
Intel® GPA 支持大量的各种指标。可供显示的指标可能会有所差异,这取决于特定的图形设备。
4.
执行“假如”实验(也称为覆盖),以帮助识别各种瓶颈而无需更改源代码
覆盖模式在显卡驱动程序内“幕后”操作,修改图形渲染管线的一个或多个渲染状态以显示该阶段对渲染过程的影响,而无需修改游戏的任何代码。
如果使用某个覆盖模式可显著提高性能,则该被覆盖的模式可能是一个性能瓶颈,因此需要对此进一步分析。
例如,使用
Null Hardware override
(仅在采用英特尔® 处理器显卡的设备上可用)来模拟一个无限快速的 GPU,观察您的游戏是否占用大量 GPU 资源。

后续步骤

如果一切顺利的话,您可以通过 System Analyzer HUD/System Analyzer 识别并解决您的游戏的问题,从而满足您的性能和可玩性目标。
如果您仍然没有达到总体目标,可以尝试以下操作:
  • 如果怀疑游戏是 GPU 密集型,捕获帧文件并使用 Graphics Frame Analyzer 执行深入分析,以确切了解在特定帧内到底发生了什么――了解您的游戏将时间花在渲染管线的什么地方,直至了解渲染目标或 draw call 层次的详细信息。查看针对桌面 API 图形应用程序的帧分析
  • 如果怀疑在 CPU 和 GPU 之间的工作负载平衡有问题,可以捕获并分析踪迹文件,跨 CPU 和 GPU 域、分任务查看游戏的情况。
  • 如果您知道游戏是 CPU 密集型的,则可以试用某些 CPU 特定工具,如英特尔® VTune™ Profiler,帮助改进 CPU 的性能。尤其是,由于现在多核已是常规而不再是例外,代码并行化对 CPU 的总体性能具有显著的影响。

Product and Performance Information

1

Intel's compilers may or may not optimize to the same degree for non-Intel microprocessors for optimizations that are not unique to Intel microprocessors. These optimizations include SSE2, SSE3, and SSSE3 instruction sets and other optimizations. Intel does not guarantee the availability, functionality, or effectiveness of any optimization on microprocessors not manufactured by Intel. Microprocessor-dependent optimizations in this product are intended for use with Intel microprocessors. Certain optimizations not specific to Intel microarchitecture are reserved for Intel microprocessors. Please refer to the applicable product User and Reference Guides for more information regarding the specific instruction sets covered by this notice.

Notice revision #20110804