Видео

第 1 集:SIMD 并行化和内联函数

在之前的讲座中,我们已经讨论了英特尔® 至强融核™ 协处理器的目的和架构。 之后,我们研究了面向英特尔至强融核协处理器的编程模型:本机和卸载。 现在我们进入第四章“表达并行化”。 在本章中,我们的目标是学习如何在应用中针对英特尔至强处理器和至强融核协处理器表达数据并行化、线程并行化和进程并行化。

Автор: Последнее обновление: 26.04.2019 - 04:05
Видео

第 2 集:自动矢量化和数组符号

我们将讨论编译器的自动矢量特性,它可用于哪里以及如何诊断它。 不过今天的讨论只涵盖自动矢量化的基本原则。 在接下来一章的课程中,我们将介绍面向矢量化的代码优化。

Автор: Последнее обновление: 26.04.2019 - 04:06
Видео

第 3 集:矢量依赖性、指示器消歧和支持 SIMD 的函数

在本视频中,我们将讨论您在使用英特尔编译器自动矢量化特性时可能会遇到的一些问题。

Автор: Последнее обновление: 26.04.2019 - 04:06
Видео

第 4 集:线程并行化和 OpenMP*

我们将讨论软件线程,尤其是使用 OpenMP 库的多线程实施。

Автор: Последнее обновление: 26.04.2019 - 04:06
Видео

第 5 集:并行循环、私有和共享变量、调度

我们将介绍私有和共享变量、并行循环及其调度。

Автор: Последнее обновление: 26.04.2019 - 04:06
Видео

第 6 集:Fork-Join 模型 OpenMP* 任务

现在我们来介绍 Fork-Join 并行化。

Автор: Последнее обновление: 26.04.2019 - 04:06
Видео

第 7 集:竞态条件和互斥体

我们将讨论使用关键和原子编译时 OpenMP 线程之间的竞态条件和同步。

Автор: Последнее обновление: 26.04.2019 - 04:06
Видео

第 8 集:并行规约

我们将讨论 OpenMP for 循环中的并行规约。

Автор: Последнее обновление: 26.04.2019 - 04:06
Видео

第 9 集:分布式内存并行化和 MPI

在本章上一集中,我们学习了如何使用矢量在每个内核的矢量平面间并行化计算。 然后,我们讨论了如何使用 OpenMP 在每颗处理器或协处理器的内核间扩展应用。 接下来,在本章最后一集 4.9 集中,我们将研究下一级别的并行化:在多台计算设备和集群环境的多个计算节点间扩展。

Автор: Последнее обновление: 26.04.2019 - 04:06
Видео

第 1 集:优化路线图

在本集中,我们将介绍“优化路线图”,即最大限度发挥应用性能需采取的步骤。

Автор: Последнее обновление: 26.04.2019 - 03:52