高效并行化

签署人: Ronald W Green 已发布: 03/20/2013 最后更新时间: 03/20/2013

高效并行化文档

面向英特尔® 集成众核架构的编译器方法

高效并行化

概述

本章介绍并行化。其中有各种并行化方法与资源的链接以及如何获取最佳并行化性能的技巧。

目标

在本章中,您将了解与英特尔编译器、英特尔® MPI、英特尔® Cilk™ Plus、以及英特尔® 线程构建模块(英特尔® TBB)一起提供的关于英特尔 OpenMP* 运行时间库的技巧。

主题

以下分章节提供更多关于并行化主题的信息。点击以下链接访问这些主题。

提示

本章将介绍各种并行化方法。对于 OpenMP,将介绍两大性能技巧:控制线程关联性和控制 OpenMP 调度。

下一步工作

要在英特尔® 至强 融核™ 协处理器上成功调试您的应用,请务必通读此指南,并点击文中的超链接查看相关内容。本指南提供了实现最佳应用性能所要执行的步骤。

下一章 《矢量化核心教程》将介绍如何实施代码矢量化的技巧以及如何实现高效矢量化的最佳方法。

产品和性能信息

1

英特尔的编译器针对非英特尔微处理器的优化程度可能与英特尔微处理器相同(或不同)。这些优化包括 SSE2、SSE3 和 SSSE3 指令集和其他优化。对于在非英特尔制造的微处理器上进行的优化,英特尔不对相应的可用性、功能或有效性提供担保。该产品中依赖于微处理器的优化仅适用于英特尔微处理器。某些非特定于英特尔微架构的优化保留用于英特尔微处理器。关于此通知涵盖的特定指令集的更多信息,请参阅适用产品的用户指南和参考指南。

通知版本 #20110804