Article

借助 MPI-3 非阻塞集合改进性能

全新 MPI-3 非阻塞集合能够提高应用性能。该改进效果在适当的应用上将会非常显著。但是对于一些应用,如果添加非阻塞集合,将会降低性能。接下来,我将介绍什么是非阻塞集合,并展示一个能够通过使用 MPI_Iallreduce 获益的内核。

作者: James T. (Intel) 最后更新时间: 2017/09/12 - 06:06
视频

第 3 集:本机 MPI 应用

在本视频中,我们将通过运行使用消息传递接口 (MPI) 的 Hello World 程序进一步介绍本机执行。

作者: 最后更新时间: 2019/04/26 - 00:05
视频

英特尔® MPI 运行时调谐

本次会议专场将重点关注英特尔® MPI 运行时自身的调谐,而不需要改变应用/工作负载本身。

作者: Wei D. (Intel) 最后更新时间: 2019/01/28 - 00:17
Article

使用英特尔® MPI 实现并行化

面向英特尔® MIC 架构进行应用的适用性分析

面向英特尔® MIC 架构的编译器方法

使用英特尔® MPI 实现并行化

作者: Ronald W Green (Blackbelt) 最后更新时间: 2019/09/30 - 17:28
Article

异构分布式系统上的有限差分

Our building block is the FD compute kernels that are typically used for RTM (reverse time migration) algorithms for seismic imaging. The computations performed by the ISO-3DFD (Isotropic 3-dimensional finite difference) stencils play a major role in accurate imaging of complex subsurface structures in oil and gas surveys and exploration. Here we leverage the ISO-3DFD discussed in [1] and [2] and...
作者: Leonardo B. (Intel) 最后更新时间: 2019/10/02 - 16:59
Article

基于英特尔® 架构加速金融应用

下载 PDF

作者: George Raskulinec (Intel) 最后更新时间: 2019/10/03 - 08:00
Article

面向使用 PME 工作负载的对称英特尔® MPI 的 GROMACS 方案

目标

该文件包(脚本及其说明)提供了针对对称英特尔运行的构建和运行环境。 该文件实际上是自述 (README) 文件包。 对称指采用至强™ 可执行文件和至强融核™ 可执行文件,两者通过英特尔 MPI 同时运行以传输 MPI 消息和集体数据。

作者: Heinrich Bockhorst (Intel) 最后更新时间: 2019/10/03 - 08:11
视频

第 9 集:分布式内存并行化和 MPI

在本章上一集中,我们学习了如何使用矢量在每个内核的矢量平面间并行化计算。 然后,我们讨论了如何使用 OpenMP 在每颗处理器或协处理器的内核间扩展应用。 接下来,在本章最后一集 4.9 集中,我们将研究下一级别的并行化:在多台计算设备和集群环境的多个计算节点间扩展。

作者: 最后更新时间: 2019/10/15 - 15:50
视频

第 17 集:通信优化 - MPI

在本集中,我们将介绍使用英特尔 MPI 和英特尔至强融核协处理器的分布式内存应用的优化机会。
 
目录:
00:09 - 面向 MIC 架构的 MPI 应用的优化
00:20 - 使用采用协处理器的 MPI 的两个选项

作者: 最后更新时间: 2019/10/15 - 15:50