Video

第 2 集:自动矢量化和数组符号

我们将讨论编译器的自动矢量特性,它可用于哪里以及如何诊断它。 不过今天的讨论只涵盖自动矢量化的基本原则。 在接下来一章的课程中,我们将介绍面向矢量化的代码优化。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 3 集:矢量依赖性、指示器消歧和支持 SIMD 的函数

在本视频中,我们将讨论您在使用英特尔编译器自动矢量化特性时可能会遇到的一些问题。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 4 集:线程并行化和 OpenMP*

我们将讨论软件线程,尤其是使用 OpenMP 库的多线程实施。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 5 集:并行循环、私有和共享变量、调度

我们将介绍私有和共享变量、并行循环及其调度。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 6 集:Fork-Join 模型 OpenMP* 任务

现在我们来介绍 Fork-Join 并行化。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 7 集:竞态条件和互斥体

我们将讨论使用关键和原子编译时 OpenMP 线程之间的竞态条件和同步。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 8 集:并行规约

我们将讨论 OpenMP for 循环中的并行规约。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 9 集:分布式内存并行化和 MPI

在本章上一集中,我们学习了如何使用矢量在每个内核的矢量平面间并行化计算。 然后,我们讨论了如何使用 OpenMP 在每颗处理器或协处理器的内核间扩展应用。 接下来,在本章最后一集 4.9 集中,我们将研究下一级别的并行化:在多台计算设备和集群环境的多个计算节点间扩展。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 1 集:优化路线图

在本集中,我们将介绍“优化路线图”,即最大限度发挥应用性能需采取的步骤。

Authored by Last updated on 04/26/2019 - 03:52
Video

第 2 集:标量调优和总体优化

在本集“标量调优和总体优化”中,我们将讨论标量运算优化和编译器友好型实践。

Authored by Last updated on 04/26/2019 - 03:54