此步骤中,您将运行锁定和等待分析,了解 algorithm_3 中出现标记为 OK 的串行 CPU 时间的原因。
分析锁定和等待
要运行锁定和等待分析,从 Amplifier 的工具栏中选择 Locks and Waits - Where is my application waiting? 并单击 Profile。
Locks and Waits:Bottom-up 窗口提供了以下数据:
此步骤中,您将运行锁定和等待分析,了解 algorithm_3 中出现标记为 OK 的串行 CPU 时间的原因。
分析锁定和等待
要运行锁定和等待分析,从 Amplifier 的工具栏中选择 Locks and Waits - Where is my application waiting? 并单击 Profile。
Locks and Waits:Bottom-up 窗口提供了以下数据:
此步骤中,您将运行并发性分析,了解应用程序是否有效利用了所有处理器内核,并识别哪些串行化程度较高的代码需要并行化。
检查并发性
要运行并发性分析,在 Amplifier 工具栏中选择 Concurrency - Where is my concurrency poor? 并单击 Profile。矩阵应用程序计算完毕退出时,Amplifier 会确定结果并打开 Concurrency 窗口:

Concurrency 窗口和 Summary 选项卡均表明,整个矩阵应用程序都是串行化的。CPU Time by Utilization 列中的红条表示处理器多核利用率低下。在Summary 选项卡显示中只有 0 或 1 个运行线程的 CPU 时间。
生成应用程序后,即可对 <install-dir>/samples/matrix 目录中所提供代码的性能进行分析。英特尔® Parallel Amplifier 提供了多种类型的分析,可收集不同类型的性能数据。在此步骤中,您将运行热点(Hotspot)分析来收集数据、查看结果并深入观察造成某个问题的相关源代码。热点分析可帮助您理解应用程序将运行时间耗费在哪些地方,并识别出最耗时的函数。
注意: 要确保应用程序的性能表现基本保持一致,请在执行其他软件数量最少的系统上完成整个调优过程。
建立测试基准
为优化前的应用程序建立一个性能测试基准:
1. 在 Visual Studio* 外启动矩阵应用程序,获得最准确数字。
注意:运行和分析应用程序之前,建议您尽量关闭计算机上运行的其他软件,以获得最准确的结果。
2. 应用程序运行后,即可在输出结果中看到执行时间:
英特尔® Parallel Amplifier 可分析并提供关于代码性能的信息。英特尔® Parallel Amplifier 能够显示性能问题,使您能针对这些性能问题集中注意力进行性能调优,并在最短时间内获得最大的性能提升。
本入门指南旨在介绍 Amplifier 的基本特性。
学完本指南后,您将能够使用 Amplifier 分析代码,从而找出可获得最大性能提升的性能热点。
本文将逐步为您介绍调优示例应用程序的全过程,并介绍其中的各个阶段:
如需直观感受入门体验,请观看Show Me 视频演示
本文分成以下几个部分:
本指南主要介绍英特尔® Parallel Composer 的基本特性。如需了解更多信息,请查看以下资源。
查找示例
N-Queens 示例包括并行性应用的演示,位于:
<install-dir>\Samples\en_US\C++\NQueens\
Parallelizing N-Queens with the Intel® Parallel Composer Sample Code Guide 文档也位于此目录中。本指南反复引用上述示例,介绍了如何使用英特尔® Parallel Composer 实现并行解决方案,解决 N-Queens 问题。
产品附带多个其他示例,可在以下位置找到:
<install-dir>\Samples\en_US\C++\
这些示例演示了特定的英特尔® Parallel Composer 优化、特性、工具和编程概念。samples.htm 文件提供了示例概述。
演示英特尔® 线程构建模块应用的示例位于:
<install-dir>\tbb\examples
初次在 Microsoft Visual Studio* 2005 上安装了英特尔® Parallel Composer 后,应确保在 Visual Studio* Debugger 中启用英特尔® Parallel Debugger Exceptions。请按以下方法操作:
要在英特尔® C++ project中应用英特尔® Integrated Performance Primitives 或英特尔® 线程构建模块,请按以下方法操作:
此时将打开 Build Component Selection 对话框。

该对话框允许您启用一个或两个英特尔性能库。
3. 在 Intel® Integrated Performance Primitives 下拉菜单中选择以下选项之一:
英特尔® Parallel Composer 软件开发产品能够帮助您进行并行编程。您可使用 Microsoft Visual Studio* 集成开发环境(IDE)在 Windows* 操作系统上基于IA-32和Intel®64架构建立和优化 C/C++ 源代码。
英特尔® Parallel Composer 包括以下组件:
本文分成以下几个部分:
英特尔® Parallel Composer 集成于以下版本的 Microsoft Visual Studio* IDE 中:
|
时间 |
第一天 |
第二天 |
英特尔® 软件网络技术讨论专区欢迎您!
这里是英特尔平台与技术及英特尔软件开发产品的交流中心。它将帮助您更加深入地了解英特尔的各类相关技术,并与全球软件开发者共享您的编程心得、技术疑难及解决方案。