使用编译器选项 -opt-threads-per-core 针对每内核的 1-4 个线程进行调度

面向英特尔® MIC 架构的编译器方法

使用编译器选项针对每内核的 1-4 条线程进行调度

本文介绍的编译器选项能够影响应用程序使用的每内核硬件线程数。


-mCG_lrb_num_threads=1|2|3|4
默认值为 2 ( Composer XE 2013 第一版, 13.0.0.079. 版本 未经正式归档/不支持的选项 )

Composer XE 2013 更新 1 和更高版本:  被支持选项 -opt-threads-per-core=1/2/3/4 默认值为 4替换。

·         该选项不影响运行时使用的每内核线程数量。它由 KMP_AFFINITYOMP_NUM_THREADS 等设置进行控制。

·         使用该选项编译的代码可以在任何(支持的硬件)每内核线程数上正常运行。

提示编译器将有多少条线程将在内核上运行。该信息用以更加有效地优化应用性能,尤其是在指令调度过程中。N 的价值应由用户决定,以匹配在执行应用过程中每个内核使用的线程数量。例如,如果应用使用 OpenMP 实现并行化,使用每内核的线程数(即 N 的值)作为 OpenMP 相似性设置,在 MIC 上执行应用代码时将使用该设置。

下一步

要在英特尔® 至强融核协处理器上成功调试您的应用,请务必通读此指南,并点击文中的超链接查看相关内容。本指南提供了实现最佳应用性能所要执行的步骤。

返回主章节,面向英特尔® 架构的高级优化

 

Reportez-vous à notre Notice d'optimisation pour plus d'informations sur les choix et l'optimisation des performances dans les produits logiciels Intel.