Intel® Parallel Amplifier

英特尔® Parallel Amplifier 入门 - 实现了哪些优化?

此步骤中,您将比较并发性分析结果。您将能够按函数查看性能变化。通过将优化前后的结果进行比较,可以评估这些优化对性能的影响及影响的程度。

要比较并发结果,请按如下操作:

  1. 完成锁定和等待分析后,对修改过的代码运行并发性分析。
  2. 单击 Profile 工具栏上的 Compare Results 按钮。
    此时将打开 Compare Results 对话框。
  3. 指定想要比较的并发性结果:


此时将打开 Concurrency:Bottom-up 窗口:

  • Intel® Parallel Amplifier
  • Параллельные вычисления
  • 英特尔® Parallel Amplifier 入门 - 程序在哪里等待?

    此步骤中,您将运行锁定和等待分析,了解 algorithm_3 中出现标记为 OK 的串行 CPU 时间的原因。


    分析锁定和等待

    要运行锁定和等待分析,从 Amplifier 的工具栏中选择 Locks and Waits - Where is my application waiting? 并单击 Profile

    Locks and Waits:Bottom-up 窗口提供了以下数据

  • Intel® Parallel Amplifier
  • Параллельные вычисления
  • 英特尔® Parallel Amplifier 入门 - 并发性在哪里存在不足?

    此步骤中,您将运行并发性分析,了解应用程序是否有效利用了所有处理器内核,并识别哪些串行化程度较高的代码需要并行化。

    检查并发性

    要运行并发性分析,在 Amplifier 工具栏中选择 Concurrency - Where is my concurrency poor? 并单击 Profile。矩阵应用程序计算完毕退出时,Amplifier 会确定结果并打开 Concurrency 窗口:



    Concurrency 窗口和 Summary 选项卡均表明,整个矩阵应用程序都是串行化的。CPU Time by Utilization 列中的红条表示处理器多核利用率低下。在Summary 选项卡显示中只有 0 或 1 个运行线程的 CPU 时间。

  • Intel® Parallel Amplifier
  • Параллельные вычисления
  • 英特尔® Parallel Amplifier 入门 - 程序在哪里耗费了时间?

    生成应用程序后,即可对 <install-dir>/samples/matrix 目录中所提供代码的性能进行分析。英特尔® Parallel Amplifier 提供了多种类型的分析,可收集不同类型的性能数据。在此步骤中,您将运行热点(Hotspot)分析来收集数据、查看结果并深入观察造成某个问题的相关源代码。热点分析可帮助您理解应用程序将运行时间耗费在哪些地方,并识别出最耗时的函数。

    注意: 要确保应用程序的性能表现基本保持一致,请在执行其他软件数量最少的系统上完成整个调优过程。

     

    建立测试基准

    为优化前的应用程序建立一个性能测试基准:

    1. 在 Visual Studio* 外启动矩阵应用程序,获得最准确数字。

    注意:运行和分析应用程序之前,建议您尽量关闭计算机上运行的其他软件,以获得最准确的结果。

    2. 应用程序运行后,即可在输出结果中看到执行时间:

  • Intel® Parallel Amplifier
  • Параллельные вычисления
  • 英特尔® Parallel Amplifier 入门

    英特尔® Parallel Amplifier 可分析并提供关于代码性能的信息。英特尔® Parallel Amplifier 能够显示性能问题,使您能针对这些性能问题集中注意力进行性能调优,并在最短时间内获得最大的性能提升。

    本入门指南旨在介绍 Amplifier 的基本特性。

    学完本指南后,您将能够使用 Amplifier 分析代码,从而找出可获得最大性能提升的性能热点。

    本文将逐步为您介绍调优示例应用程序的全过程,并介绍其中的各个阶段:

    • 定位性能问题
    • 修改代码以消除问题
    • 检测新代码的性能变化

    如需直观感受入门体验,请观看Show Me 视频演示


    本文分成以下几个部分:

  • Intel® Parallel Amplifier
  • Параллельные вычисления
  • 英特尔® Parallel Studio:多核软件开发动力之源

    英特尔® Parallel Studio:多核软件开发动力之源

    英特尔® Parallel Studio是一个针对Microsoft Visual Studio C/C++开发者的综合并行开发套件,由英特尔® Parallel Composer, 英特尔® Parallel Inspector, 和英特尔® Parallel Amplifier等构成英特尔® Parallel Studio,使得基于Windows的开发人员能够更加简便、快捷地创建、调试和优化多核应用软件。

    英特尔® Parallel Studio:开发周期并行化
    英特尔® Parallel Studio为使用Microsoft Visual Studio C/C++的开发人员提供了简捷的端到端并行化工具。该产品是众多并行软件专家和高性能计算领域研究人员的结晶,是这些专家25年工作的经验总结。英特尔公司还提供了加强版的工具,以便对串行的或者并行的Windows应用软件进行软件是首个可以迅速满足开发人员并行需求的产品,具有下列功能:

  • C/C++
  • Intel® Parallel Composer
  • Intel® Parallel Studio
  • Intel® Parallel Amplifier
  • Intel® Parallel Inspector
  • Параллельные вычисления
  • How to troubleshoot if Microsoft* Visual Studio integration with Intel® Parallel Inspector does not work and the controls are not visible or exposed properly

    Problem : You have successfully installed Intel® Parallel Amplifier (or any Intel® Parallel Studio tools) but the toolbar for Parallel Amplifier (or whatever Parallel Studio tool(s) you installed) does not appear in Visual Studio.


    Environment : Microsoft* Visual Studio* versions that have installed Parallel Studio tools.


    Root Cause : Tool bar is not visible, either because it is not enabled or it is obscured by other tool bars that are enabled.

  • Intel® Parallel Amplifier
  • Intel® Parallel Composer
  • Intel® Parallel Inspector
  • Intel(R) Parallel Composer
  • Intel(R) Parallel Inspector
  • Intel(R) Parallel Studio
  • Intel(R) Parallel Amplifier
  • Параллельные вычисления
  • No data to show. Why your application does not consume enough CPU time?

    With the Hotspot and Concurrency analyses a user might receive this message:

    "No data to show. Your application does not consume enough CPU time to be measured by the statistical method employed in this product. Try to increase the time your workload runs or use Locks and Waits mode to gather performance data on your application."

    Likewise, the Locks and Waits analysis may result with the similar message:

  • Intel® Parallel Amplifier
  • Параллельные вычисления
  • 英特尔® Parallel Amplifier 入门(二)

    生成应用程序

    首先,您需要在 Microsoft* Visual Studio* 环境中建立示例应用程序。本指南中的矩阵示例应用程序用于计算矩阵变换。为便于分析并快速评估优化效果,应用程序中包含一个计时器,可显示计算矩阵变换所用的时间。

    建立应用程序:

    1. 在 Visual Studio* 中,选择 File > Open > Project/Solution,导航至 <install_dir>\samples\matrix\matrix.vcproj。
    2. 项目将被添加到 Visual Studio*,显示在 Solution Explorer 中。选择 Build > Build Solution
      即生成 matrix.exe 应用程序。
  • Intel® Parallel Amplifier
  • Параллельные вычисления
  • Страницы

    Подписаться на Intel® Parallel Amplifier