对用户源代码更改进行预测

概述

尽管大多数代码几乎无需更改即可在英特尔® 集成众核架构(英特尔® MIC 架构)上运行,然而如欲实现高效运行,可能需要对用户源代码进行更改。本章探讨了一些与用户源代码更改相关的通用算法问题,以支持应用实现最佳性能。

主题

应用不能实现最佳性能的原因之一可能是代码受内存宽带的限制。例如,如果没有面向高速缓存架构对代码进行模块化封装,从而导致高速缓存未命中,这种现象便会发生。另一个原因可能是,由于无规律的内存访问导致代码仅实现了部分矢量化。在这种情况下,为了提升应用性能,程序员需要更改算法。您可以在下面的论文中找到关于此类算法更改的更多信息:

ISCA 2012 论文:《传统编程是否能缩小并行计算应用的 Ninja 性能差距?》2012 6 月)

本指南在接下来的章节中将介绍几种有助于消除内存宽带限制的新方法。

讯息

受内存宽带限制的代码性能会表现出较差的性能。如果可能的话,用户原代码更改可以消除其中一些瓶颈,有助于编译器更好地优化您的应用。

下一步

要在英特尔® 至强融核协处理器上成功调试您的应用,请务必通读此指南,并点击文中的超链接查看相关内容。本指南提供了实现最佳应用性能所要执行的步骤。

返回为英特尔® 集成众核架构做好准备(英特尔® MIC 架构)

Pour de plus amples informations sur les optimisations de compilation, consultez notre Avertissement concernant les optimisations.