Article

借助 MPI-3 非阻塞集合改进性能

全新 MPI-3 非阻塞集合能够提高应用性能。该改进效果在适当的应用上将会非常显著。但是对于一些应用,如果添加非阻塞集合,将会降低性能。接下来,我将介绍什么是非阻塞集合,并展示一个能够通过使用 MPI_Iallreduce 获益的内核。

Authored by James T. (Intel) Last updated on 09/12/2017 - 06:06
Video

第 3 集:本机 MPI 应用

在本视频中,我们将通过运行使用消息传递接口 (MPI) 的 Hello World 程序进一步介绍本机执行。

Authored by Last updated on 04/26/2019 - 00:05
Video

英特尔® MPI 运行时调谐

本次会议专场将重点关注英特尔® MPI 运行时自身的调谐,而不需要改变应用/工作负载本身。

Authored by Wei D. (Intel) Last updated on 01/28/2019 - 00:17
Article

使用英特尔® MPI 实现并行化

面向英特尔® MIC 架构进行应用的适用性分析

面向英特尔® MIC 架构的编译器方法

使用英特尔® MPI 实现并行化

Authored by Ronald W Green (Blackbelt) Last updated on 09/30/2019 - 17:28
Article

异构分布式系统上的有限差分

Our building block is the FD compute kernels that are typically used for RTM (reverse time migration) algorithms for seismic imaging. The computations performed by the ISO-3DFD (Isotropic 3-dimensional finite difference) stencils play a major role in accurate imaging of complex subsurface structures in oil and gas surveys and exploration. Here we leverage the ISO-3DFD discussed in [1] and [2] and...
Authored by Leonardo B. (Intel) Last updated on 10/02/2019 - 16:59
Article

基于英特尔® 架构加速金融应用

下载 PDF

Authored by George Raskulinec (Intel) Last updated on 10/03/2019 - 08:00
Article

面向使用 PME 工作负载的对称英特尔® MPI 的 GROMACS 方案

目标

该文件包(脚本及其说明)提供了针对对称英特尔运行的构建和运行环境。 该文件实际上是自述 (README) 文件包。 对称指采用至强™ 可执行文件和至强融核™ 可执行文件,两者通过英特尔 MPI 同时运行以传输 MPI 消息和集体数据。

Authored by Heinrich Bockhorst (Intel) Last updated on 10/03/2019 - 08:11
Article

在英特尔® 数学核心函数库中引入 DNN 基元

    深度神经网络 (DNN) 处于机器学习领域的前沿。这些算法在 20 世纪 90 年代后期得到了行业的广泛采用,最初应用于诸如银行支票手写识别等任务。深度神经网络在这一任务领域已得到广泛运用,达到甚至超过了人类能力。如今,DNN 已用于图像识别、视频和自然语言处理以及解决复杂的视觉理解问题,如自主驾驶等。DNN 在计算资源及其必须处理的数据量方面要求非常苛刻。

Authored by Vadim Pirogov (Intel) Last updated on 10/15/2019 - 15:06
Video

第 9 集:分布式内存并行化和 MPI

在本章上一集中,我们学习了如何使用矢量在每个内核的矢量平面间并行化计算。 然后,我们讨论了如何使用 OpenMP 在每颗处理器或协处理器的内核间扩展应用。 接下来,在本章最后一集 4.9 集中,我们将研究下一级别的并行化:在多台计算设备和集群环境的多个计算节点间扩展。

Authored by Last updated on 10/15/2019 - 15:50
Video

第 17 集:通信优化 - MPI

在本集中,我们将介绍使用英特尔 MPI 和英特尔至强融核协处理器的分布式内存应用的优化机会。
 
目录:
00:09 - 面向 MIC 架构的 MPI 应用的优化
00:20 - 使用采用协处理器的 MPI 的两个选项

Authored by Last updated on 10/15/2019 - 15:50