Product Support
内存分配和首次访问
内存分配和首次访问
相对至强而言,协处理器的内存分配成本较高——因此尽可能重复使用已非配的内存是非常明智的。例如,如果某函数被重复调用(假设在循环内),并且该函数使用数组作为临时存储,尝试初次分配足够大的数组(所需的最大大小),并在后续调用中重复使用该数组:
static real *temp_array=0;
使用编译器选项 -opt-threads-per-core 针对每内核的 1-4 个线程进行调度
面向英特尔® MIC 架构的高级优化
概述
本章详细介绍了一些高级的编译器优化选项,以提升英特尔® MIC 架构的性能。其中包括以下主题,如浮点模型、预取、流存储的使用等。本章非常适用于尚未获得理想性能或寻求尽可能高的性能提升的用户。
常见的向量化技巧
避免人工循环展开
随机数函数向量化
Drand48 Vectorization in C/C++
Goodman, Steve9700.00000000000
向量化要素,随机数函数向量化
使用全向量和 -opt-assume-safe-padding 选项
Vec BKM Utilize full-vectors by
Document9800.00000000000
Vec BKM 使用全向量,Document9800.00000000000
