Video

第 4 集:线程并行化和 OpenMP*

我们将讨论软件线程,尤其是使用 OpenMP 库的多线程实施。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 6 集:Fork-Join 模型 OpenMP* 任务

现在我们来介绍 Fork-Join 并行化。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 5 集:并行循环、私有和共享变量、调度

我们将介绍私有和共享变量、并行循环及其调度。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 8 集:并行规约

我们将讨论 OpenMP for 循环中的并行规约。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 18 集:其他主题 - 异构系统中的负载平衡

在本视频中,我们将介绍异构系统中的负载平衡。

Authored by Last updated on 04/26/2019 - 04:01
Video

第 7 集:竞态条件和互斥体

我们将讨论使用关键和原子编译时 OpenMP 线程之间的竞态条件和同步。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 9 集:分布式内存并行化和 MPI

在本章上一集中,我们学习了如何使用矢量在每个内核的矢量平面间并行化计算。 然后,我们讨论了如何使用 OpenMP 在每颗处理器或协处理器的内核间扩展应用。 接下来,在本章最后一集 4.9 集中,我们将研究下一级别的并行化:在多台计算设备和集群环境的多个计算节点间扩展。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 8 集:多线程应用中的同步优化

我们继续讨论优化,接下来我们讨论线程并行化的优化。

Authored by Last updated on 04/26/2019 - 03:57
Article

面向英特尔® 架构优化的 Caffe*:使用现代代码技巧

This paper demonstrates a special version of Caffe* — a deep learning framework originally developed by the Berkeley Vision and Learning Center (BVLC) — that is optimized for Intel® architecture.
Authored by Last updated on 07/06/2019 - 16:40
Article

整理您的数据和代码: 数据和布局 - 第 2 部分

Apply the concepts of parallelism and distributed memory computing to your code to improve software performance. This paper expands on concepts discussed in Part 1, to consider parallelism, both vectorization (single instruction multiple data SIMD) as well as shared memory parallelism (threading), and distributed memory computing.
Authored by David M. Last updated on 07/06/2019 - 16:40