• Intel® Graphics Performance Analyzers 2020 R1
  • 12/20/2019
  • Public Content
Contents

分析桌面 API 图形应用程序

使用 Intel® Graphics Performance Analyzers (Intel® GPA) 分析桌面 API 图形应用程序时,可以:
  • 实时收集和显示您的应用的硬件和软件指标数据,并使用 System Analyzer 或 System Analyzer HUD 进行 Microsoft* Direct3D 管线试验。这样有助于您大致了解图形应用程序的性能、确定应用程序是 CPU 密集型还是 GPU 密集型,并迅速隔离图形瓶颈。
  • 创建流文件,以便利用 Graphics Frame Analyzer(用于 DirectX 11 和 Vulkan)进行进一步分析。
  • 创建帧捕获文件;这些文件包含所有用于渲染选定 3D 帧,以及每个 draw call/区域的 GPU 指标的 Microsoft DirectX* 环境。
  • 在应用程序运行期间收集实时踪迹数据,利用 Graphics Trace Analyzer 进行进一步分析。
  • 利用 Graphics Frame Analyzer 了解您的应用程序在帧级别、渲染目标级别和 draw call 级别的性能:
    • 利用单个事件(即任何可能向帧缓冲区渲染一个或多个像素或完成另一 GPU 工作的调用)以及针对整个渲染管线的各种设置进行实验。
    • 修改状态和着色器代码,以查看是否可以缩短渲染时间。
    • 确定纹理的带宽是否为性能瓶颈。
    • 分析像素记录,尽量避免过度绘制
    • 进行“假如”优化实验,而不重新编译或重新构建您的应用程序。
  • 利用 Graphics Trace Analyzer 可视化呈现代码中各种任务在一段时间内的执行情况。
    • 了解每个瞬间的 GPU 使用情况并分析 GPU 引擎的软件队列。
    • 分析图形 API 调用(draw calls、缓冲区锁定、资源更新、演示)。
    • 将 CPU 和 GPU 的活动相关联,并辨别应用程序是受 GPU 制约,还是受 CPU 制约。
    • 识别 GPU 和 CPU 应用程序的帧速率,以及帧速率如何取决于垂直同步。
    • 根据选定的 GPU 指标了解应用程序在一段时间的性能。
    • 分析软件队列上每个 DMA 数据包的 GPU 使用情况。
您不需要代码修改或特殊库,以确定游戏是 CPU 密集型还或 GPU 密集型,以及找出游戏中具体帧内发生的情况。
此外,还可以利用检测和跟踪技术 (ITT) API 检测应用程序,在 Graphics Trace Analyzer 中可视化代码随着时间推移执行各种任务的档案:只需在游戏代码中添加调用来指定游戏中的逻辑任务。您还可以使用 System Analyzer 分析采用 ITT API 的非 Directx* 应用程序。在这种情况下,
Metric Tree Control
窗格中仅显示 CPU 指标,只启用了
Capture Trace
按钮。
有关 ITT API 的详细信息,请参见关于指令和跟踪技术 API 的主题。
备注
32 位系统不支持 Intel® GPA。

Performance Analysis 流程

Graphics Monitor 是应用程序分析的主控单元工具。您必须先在目标系统上运行 Graphics Monitor,然后才能启动应用程序进行分析。
  1. 打开 Graphics Monitor,启动应用程序配置分析设置
  2. 使用目标系统 IP 地址,将安装在主机系统上的 Intel® GPA 工具连接到目标系统。如果您要分析本地的应用程序,可以指定“这台机器”或“localhost”。
    备注
    当您第一次连接到目标系统上时,Graphics Monitor 会要求您授权连接。点击
    Accept Once
    以仅允许当前的会话连接,或
    Accept Always
    以将设备的 IP 地址添加到授权设备列表中。
  3. 使用 System Analyzer 或 System Analyzer HUD 执行系统分析
  4. 捕获流、帧或踪迹文件,进行进一步的深度分析:
    • 执行流分析,探测具有潜在性能瓶颈的帧。
    • 执行帧分析,了解渲染管线不同阶段的特定 draw calls 对性能的影响。
    • 执行平台分析以深入了解您的 CPU 和 GPU 利用率方面的应用性能。
      提示
      默认情况下,跟踪被禁用。要启用平台分析,在
      Graphics Monitor
      Options
      屏幕上的
      Trace
      选项卡中,启用
      T
      racing
      切换按钮。
  5. 更改游戏代码,然后重新运行 Intel® GPA,验证所做更改是否实现了预期的性能改进:
 

Product and Performance Information

1

Intel's compilers may or may not optimize to the same degree for non-Intel microprocessors for optimizations that are not unique to Intel microprocessors. These optimizations include SSE2, SSE3, and SSSE3 instruction sets and other optimizations. Intel does not guarantee the availability, functionality, or effectiveness of any optimization on microprocessors not manufactured by Intel. Microprocessor-dependent optimizations in this product are intended for use with Intel microprocessors. Certain optimizations not specific to Intel microarchitecture are reserved for Intel microprocessors. Please refer to the applicable product User and Reference Guides for more information regarding the specific instruction sets covered by this notice.

Notice revision #20110804