英特尔® Parallel Amplifier 入门 - 实现了哪些优化?

此步骤中,您将比较并发性分析结果。您将能够按函数查看性能变化。通过将优化前后的结果进行比较,可以评估这些优化对性能的影响及影响的程度。

要比较并发结果,请按如下操作:

  1. 完成锁定和等待分析后,对修改过的代码运行并发性分析。
  2. 单击 Profile 工具栏上的 Compare Results 按钮。
    此时将打开 Compare Results 对话框。
  3. 指定想要比较的并发性结果:


此时将打开 Concurrency:Bottom-up 窗口:

 

单线程 matrix.exe 应用程序的 CPU 时间,处理器利用率低下。

 

经过优化的多线程 matrix.exe 应用程序的 CPU 时间,处理器利用率被标记为 OK。

 

CPU time 列提供了两个结果之间的差异,格式如下:<CPU 时间差> = <结果 1 的 CPU 时间> - <结果 2 的 CPU 时间>。例如,对于 algorithm_3,结果 2 的 CPU 时间优化为 16 秒。

    

比较汇总提供了两方面结果的数据:1) 总用时是应用程序的执行时间;2) CPU 时间是所有线程的 CPU 时间之和;3) 逻辑 CPU 利用率是应用程序运行期间所有核心的平均利用率;4) 您的机器的逻辑 CPU 计数。

   

并发图显示了两个结果的运行时间差 <结果 1 的运行时间> - <结果 2 的运行时间>。


比较汇总显示出,在运行两个线程时,多线程版本的 matrix.exe 应用程序(结果 2)可实现理想的 CPU 利用率(目标并发性的 86-115%),并为 algorithm_3 热点函数实现了16 秒的优化。

有关编译器优化的更完整信息,请参阅优化通知