面向英特尔® MIC 架构的高级优化

面向英特尔® MIC 架构的高级优化

概述

本章详细介绍了一些高级的编译器优化选项,以提升英特尔® MIC 架构的性能。其中包括以下主题,如浮点模型、预取、流存储的使用等。本章非常适用于尚未获得理想性能或寻求尽可能高的性能提升的用户。

目标与主题

本章的目的是探索多种高级优化技术,以确定哪种适合您的应用:

·         浮点模型——平衡性能与精确度和再生性

·         浮点模型——至强和 MIC 之间的差异

·         面向 MIC 和至强低精度运算功能的编译器选项

·         面向 MIC 的数据预取

·         使用编译器选项和指令针对每内核的 1-4 条线程进行调度

·         英特尔® MIC 架构流存储

·           MIC 上选择性地使用 gatherhint/scatterhint 指令

·         数据首次触摸考虑因素和优化

下一步

要在英特尔® 至强融核架构上成功调试您的应用,请务必通读此指南,并点击文中的超链接查看相关内容。本指南提供了实现最佳应用性能所要执行的步骤。

下一章本地和卸载编程模式将介绍多种编程模式和数据考虑事项,帮您从英特尔® 集成众核架构(英特尔® MIC 架构)中获得最佳性能。

 

有关编译器优化的更完整信息,请参阅优化通知