Article

OpenMP* 线程相似性控制

面向 MIC Compi 的英特尔® Composer XE 文档

面向英特尔® MIC 架构的编译器方法

面向英特尔® MIC 架构的编译器方法 高效并行化,OpenMP 线程相似性控制

概述

Authored by Ronald W Green (Blackbelt) Last updated on 03/21/2019 - 12:08
Article

OpenMP* 循环调度

面向英特尔® MIC 架构的编译器方法

OpenMP 循环调度

使用以下通用形式的并行结构调度 OpenMP 循环:

示例

#pragma omp parallel for schedule(kind [, chunk size])

Authored by Ronald W Green (Blackbelt) Last updated on 03/21/2019 - 12:08
Article

OpenMP 相关技巧

面向英特尔® MIC 架构的编译器方

Authored by AmandaS (Intel) Last updated on 03/21/2019 - 12:00
Article

使用 OpenMP* 实现并行化

面向英特尔® MIC 架构进行应用的适用性分析

文档

Authored by Ronald W Green (Blackbelt) Last updated on 03/21/2019 - 12:08
Article

在英特尔® 集成众核 (英特尔® MIC) 架构上使用 OpenMP* 的最佳设计方案

本文是对“面向 Linux* 的英特尔® Composer XE”文档的补充。 本文对在为英特尔集成众核 (Intel MIC) 架构编写卸载和本地程序时使用 C/C++ 和 Fortran 的 OpenMP* 扩展的最佳方法进行了概括。
Authored by Last updated on 03/21/2019 - 12:00
Article

面向英特尔® 至强® 处理器和英特尔® 至强融核™ 协处理器等多核和众核产品的编程

如今用于多核处理器的编程模式也可用于众核协处理器。因此,说明并行编程选项是说明如何对英特尔至强处理器和英特尔至强融核协处理器进行编程的最好方式。本文为了解如何通过一种抽象、直观且有效的统一编程方法实现多核处理器和众核协处理器的最佳编程奠定了基础。这种方法非常简单自然,因为它能够轻松满足如今应用的需求并带来出色的成果。与英特尔® 众核处理器和英特尔® 多核协处理器所利用的通用英特尔® 架构指令库结合使用时,它能够比其他不太直观的方法更轻松地实现高度并行计算性能。 利用多核处理器和众核协处理器的程序可提供多种选项来满足各种需求。这些选项可充分利用目前广泛采用的解决方案,如 C、C++、Fortran、OpenMP*、MPI 和英特尔® 线程构建模块(英特尔® TBB),并且正在快速推动 OpenCL* 等其他新兴标准以及英特尔® Cilk™ Plus 等全新开放模型的发展。
Authored by James R. (Blackbelt) Last updated on 03/21/2019 - 12:00
Article

应用蚁群优化算法 (ACO) 实施交通网络扩展

In this article an OpenMP* based implementation of the Ant Colony Optimization algorithm was analyzed for bottlenecks with Intel® VTune™ Amplifier XE 2016 together with improvements using hybrid MPI-OpenMP and Intel® Threading Building Blocks were introduced to achieve efficient scaling across a four-socket Intel® Xeon® processor E7-8890 v4 processor-based system.
Authored by Sunny G. (Intel) Last updated on 07/05/2019 - 19:13
Article

高效并行化

高效并行化文档

面向英特尔® 集成众核架构的编译器方法

高效并行化

Authored by Ronald W Green (Blackbelt) Last updated on 03/21/2019 - 12:00
Article

在Intel® MIC多核架构上使用OpenMP*库的编程及调优实践

    本文将主要介绍在Intel® MIC多核架构上运行及优化OpenMP*多线程程序的相关技术,且将围绕offload及native两种运行时执行环境展开详解。

OpenMP编程模型包含了众多调优的编程接口及环境变量设置,本文将就此介绍如何更好地实现程序的高效运行。

Authored by Last updated on 03/21/2019 - 12:08
Article

使用编译器选项 -opt-threads-per-core 针对每内核的 1-4 个线程进行调度

面向英特尔® MIC 架构的编译器方法

使用编译器选项针对每内核的 1-4 条线程进行调度

Authored by AmandaS (Intel) Last updated on 03/21/2019 - 12:00