Article

英特尔向量化工具箱:3. 使用英特尔编译器的向量化报告确定候选循环

英特尔向量化工具箱:3. 使用英特尔编译器的向量化报告确定候选循环
Authored by Ronald W Green (Blackbelt) Last updated on 05/25/2018 - 15:30
Article

英特尔® MKL 中的英特尔® AVX 优化代码

Starting from Intel MKL 10.3, AVX code will be dispatched as one of the platforms in MKL and does not require special activation as in MKL 10.2.
Authored by Vipin Kumar E K (Intel) Last updated on 03/27/2019 - 12:20
Article

英特尔 MKL 中全新的快速基本随机数生成器

New BRNG SFMT19937 in Intel MKL
Authored by Chao Y (Intel) Last updated on 03/27/2019 - 12:20
Article

英特尔® MKL 提供针对 2D/3D FFT 的 Split Complex (real real) 支持

Split complex (real real) support for 2D/3D FFTs has been added from Intel® MKL 10.3 onwards.
Authored by Vipin Kumar E K (Intel) Last updated on 03/27/2019 - 12:20
Article

使用英特尔® 线程构建模块(英特尔® TBB)实现并行化

面向英特尔® MIC 架构的编译器方法

使用英特尔® 线程构建模块(英特尔® TBB)实现并行化

概述

Authored by Ronald W Green (Blackbelt) Last updated on 08/01/2019 - 09:30
Article

使用Intel® Fortran编译器编译Coarray程序

Coarray是在Fortran 2008中实现标准化的一种数据共享概念, 它通过使用同一个程序的多个拷贝来实现并行处理。这里的每一个拷贝,也被称image,同时拥有普通局部变量和叫做coarray的共享变量。一个共享变量既可以是一个数组也可以是一个标量,它的存储空间会跨越一个程序对应的所有image。

Authored by Duan, Xiaoping (Intel) Last updated on 12/29/2018 - 00:37
Article

如何在offload代码输入输出变量的内存分配中使用2M大页面

英特尔编译器为至强融核™ 协处理器提供的offload编译模式使程序员可以在一段主机代码中加入编译指示或者某些新的关键字使指定的代码段运行在协处理器上。在显式拷贝模式下,程序员在使用offload pragma/directive将指定代码段offload到协处理器上执行的同时,还须指定在主机和扩展卡间进行拷贝的指针或数组类型变量。

Authored by Duan, Xiaoping (Intel) Last updated on 07/05/2019 - 14:28
Article

解读Intel编译器的offload报告

英特尔编译器在对代码进行编译优化的过程中用户可以通过使用”-opt-report-phase=phase”选项让编译器输出某些特定优化阶段的相关信息。针对至强融核™ 协处理器提供的offload编译模式英特尔编译器提供了”offload”关键字。

Authored by Duan, Xiaoping (Intel) Last updated on 06/07/2017 - 10:36
Article

如何在offload程序中控制协处理器的执行环境

在offload编译模式下Intel编译器的offload运行时系统提供了两种机制让主机CPU程序对协处理器上的执行环境进行控制:

Authored by Duan, Xiaoping (Intel) Last updated on 06/07/2017 - 10:28
Article

OpenMP* WORKSHARE 现在可与英特尔® Fortran 编译器 15.0 并行

英特尔® Fortran 编译器 15.0 现可为包含阵列分配的 OpenMP WORKSHARE 和 PARALLEL WORKSHARE 结构的指定实例生成多线程代码。  很显然,它们是使用 OpenMP SINGLE 结构进行部署,这表示仅可生成单线程代码。

 

Authored by Kenneth Craft (Intel) Last updated on 07/03/2019 - 20:00