使用编译器选项针对每内核的 1-4 条线程进行调度
本文介绍的编译器选项能够影响应用程序使用的每内核硬件线程数。
-mCG_lrb_num_threads=1|2|3|4(默认值为 2) ( Composer XE 2013 第一版, 13.0.0.079. 版本 未经正式归档/不支持的选项 )
Composer XE 2013 更新 1 和更高版本: 被支持选项 -opt-threads-per-core=1/2/3/4 和(默认值为 4)替换。
· 该选项不影响运行时使用的每内核线程数量。它由 KMP_AFFINITY、OMP_NUM_THREADS 等设置进行控制。
· 使用该选项编译的代码可以在任何(支持的硬件)每内核线程数上正常运行。
提示编译器将有多少条线程将在内核上运行。该信息用以更加有效地优化应用性能,尤其是在指令调度过程中。N 的价值应由用户决定,以匹配在执行应用过程中每个内核使用的线程数量。例如,如果应用使用 OpenMP 实现并行化,使用每内核的线程数(即 N 的值)作为 OpenMP 相似性设置,在 MIC 上执行应用代码时将使用该设置。
下一步
要在英特尔® 至强融核™ 协处理器上成功调试您的应用,请务必通读此指南,并点击文中的超链接查看相关内容。本指南提供了实现最佳应用性能所要执行的步骤。
返回主章节,面向英特尔® 架构的高级优化
