Оптимизация? Конечно, каждый сталкивался с данной задачей при разработке своих, сколь-нибудь значительных, требующих определённых вычислений, приложений. При этом способов оптимизировать код существует огромное множество, и, как следствие, различных путей сделать это в автоматическом режиме с помощью опций компилятора. Вот здесь и возникает проблема – как выбрать то, что нужно нам и не запутаться?
Intel® Fortran Compiler
如何实现最高传输速率
异构编程模式
内存分配和首次访问
内存分配和首次访问
相对至强而言,协处理器的内存分配成本较高——因此尽可能重复使用已非配的内存是非常明智的。例如,如果某函数被重复调用(假设在循环内),并且该函数使用数组作为临时存储,尝试初次分配足够大的数组(所需的最大大小),并在后续调用中重复使用该数组:
static real *temp_array=0;
使用编译器选项 -opt-threads-per-core 针对每内核的 1-4 个线程进行调度
面向英特尔® MIC 架构的高级优化
概述
本章详细介绍了一些高级的编译器优化选项,以提升英特尔® MIC 架构的性能。其中包括以下主题,如浮点模型、预取、流存储的使用等。本章非常适用于尚未获得理想性能或寻求尽可能高的性能提升的用户。
