URL

英特尔® Parallel Amplifier 入门 - 程序在哪里等待?

此步骤中,您将运行锁定和等待分析,了解 algorithm_3 中出现标记为 OK 的串行 CPU 时间的原因。


分析锁定和等待

要运行锁定和等待分析,从 Amplifier 的工具栏中选择 Locks and Waits - Where is my application waiting? 并单击 Profile

Locks and Waits:Bottom-up 窗口提供了以下数据

  • Intel® Parallel Amplifier
  • Parallel Computing
  • 英特尔® Parallel Amplifier 入门 - 并发性在哪里存在不足?

    此步骤中,您将运行并发性分析,了解应用程序是否有效利用了所有处理器内核,并识别哪些串行化程度较高的代码需要并行化。

    检查并发性

    要运行并发性分析,在 Amplifier 工具栏中选择 Concurrency - Where is my concurrency poor? 并单击 Profile。矩阵应用程序计算完毕退出时,Amplifier 会确定结果并打开 Concurrency 窗口:



    Concurrency 窗口和 Summary 选项卡均表明,整个矩阵应用程序都是串行化的。CPU Time by Utilization 列中的红条表示处理器多核利用率低下。在Summary 选项卡显示中只有 0 或 1 个运行线程的 CPU 时间。

  • Intel® Parallel Amplifier
  • Parallel Computing
  • 英特尔® Parallel Amplifier 入门 - 程序在哪里耗费了时间?

    生成应用程序后,即可对 <install-dir>/samples/matrix 目录中所提供代码的性能进行分析。英特尔® Parallel Amplifier 提供了多种类型的分析,可收集不同类型的性能数据。在此步骤中,您将运行热点(Hotspot)分析来收集数据、查看结果并深入观察造成某个问题的相关源代码。热点分析可帮助您理解应用程序将运行时间耗费在哪些地方,并识别出最耗时的函数。

    注意: 要确保应用程序的性能表现基本保持一致,请在执行其他软件数量最少的系统上完成整个调优过程。

     

    建立测试基准

    为优化前的应用程序建立一个性能测试基准:

    1. 在 Visual Studio* 外启动矩阵应用程序,获得最准确数字。

    注意:运行和分析应用程序之前,建议您尽量关闭计算机上运行的其他软件,以获得最准确的结果。

    2. 应用程序运行后,即可在输出结果中看到执行时间:

  • Intel® Parallel Amplifier
  • Parallel Computing
  • 英特尔® Parallel Amplifier 入门

    英特尔® Parallel Amplifier 可分析并提供关于代码性能的信息。英特尔® Parallel Amplifier 能够显示性能问题,使您能针对这些性能问题集中注意力进行性能调优,并在最短时间内获得最大的性能提升。

    本入门指南旨在介绍 Amplifier 的基本特性。

    学完本指南后,您将能够使用 Amplifier 分析代码,从而找出可获得最大性能提升的性能热点。

    本文将逐步为您介绍调优示例应用程序的全过程,并介绍其中的各个阶段:

    • 定位性能问题
    • 修改代码以消除问题
    • 检测新代码的性能变化

    如需直观感受入门体验,请观看Show Me 视频演示


    本文分成以下几个部分:

  • Intel® Parallel Amplifier
  • Parallel Computing
  • 英特尔® Parallel Composer 入门 - 后续步骤

    本指南主要介绍英特尔® Parallel Composer 的基本特性。如需了解更多信息,请查看以下资源。


    查找示例

    N-Queens 示例包括并行性应用的演示,位于:

    <install-dir>\Samples\en_US\C++\NQueens\

    Parallelizing N-Queens with the Intel® Parallel Composer Sample Code Guide 文档也位于此目录中。本指南反复引用上述示例,介绍了如何使用英特尔® Parallel Composer 实现并行解决方案,解决 N-Queens 问题。

    产品附带多个其他示例,可在以下位置找到:

    <install-dir>\Samples\en_US\C++\

    这些示例演示了特定的英特尔® Parallel Composer 优化、特性、工具和编程概念。samples.htm 文件提供了示例概述。

    演示英特尔® 线程构建模块应用的示例位于:

    <install-dir>\tbb\examples

  • Intel® Parallel Composer
  • Parallel Computing
  • 英特尔® Parallel Composer 入门 - 使用英特尔® Parallel Debugger Extension 调试代码

    初次在 Microsoft Visual Studio* 2005 上安装了英特尔® Parallel Composer 后,应确保在 Visual Studio* Debugger 中启用英特尔® Parallel Debugger Exceptions。请按以下方法操作:

  • Intel® Parallel Composer
  • Parallel Computing
  • 英特尔® Parallel Composer 入门 - 使用英特尔® 性能库

    要在英特尔® C++ project中应用英特尔® Integrated Performance Primitives 或英特尔® 线程构建模块,请按以下方法操作:

    1. 在 Solution Explorer 中打开项目。
    2. 在菜单栏中,选择 Project > Intel Parallel Composer > Build Component Selection

    此时将打开 Build Component Selection 对话框。
     

    该对话框允许您启用一个或两个英特尔性能库。

    3. 在 Intel® Integrated Performance Primitives 下拉菜单中选择以下选项之一:

  • Intel® Parallel Composer
  • Parallel Computing
  • 英特尔® Parallel Composer 入门

    英特尔® Parallel Composer 软件开发产品能够帮助您进行并行编程。您可使用 Microsoft Visual Studio* 集成开发环境(IDE)在 Windows* 操作系统上基于IA-32和Intel®64架构建立和优化  C/C++ 源代码。

    英特尔® Parallel Composer 包括以下组件:

    •  英特尔® C++ 编译器(Intel C++ Compiler)
    •  英特尔® 线程构建模块(Intel Threading Building Blocks)
    •  英特尔® 集成性能基元(Intel Integrated Performance Primitives)
    •  英特尔® 并行调试器扩展Parallel Debugger Extension

    本文分成以下几个部分:

    1. 启动英特尔® Parallel Composer

      英特尔® Parallel Composer 集成于以下版本的 Microsoft Visual Studio* IDE 中:

  • Intel® Parallel Composer
  • Parallel Computing
  • 英特尔®平台并行程序设计课程:初级-并行编程基础

    平台:英特尔®多核处理器平台

    实验环境:Microsoft Windows*/Linux*

    课程长度:1.5 天

    课程费用:¥1500/人

    目标学员:课程适合有一定程序设计经验(两年以上)的初级程序员

    课程描述:本课程为期一天半,采用课堂讲解与动手实验相结合的方式,讲授并行程序设计的基本概念和方法,主要讲解“四步走”(问题及服务描述,并行分解方法设计实现和简单调优)方法学和在通用平台(Windows*)上的实现手段。课程结束,学员将能开始进行并行程序的开发。

    课程安排:

    时间

    第一天

    第二天

  • Professoren
  • Studenten
  • Entwickler
  • Seiten

    URL abonnieren