Video

第 4 集:线程并行化和 OpenMP*

我们将讨论软件线程,尤其是使用 OpenMP 库的多线程实施。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 6 集:Fork-Join 模型 OpenMP* 任务

现在我们来介绍 Fork-Join 并行化。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 5 集:并行循环、私有和共享变量、调度

我们将介绍私有和共享变量、并行循环及其调度。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 8 集:并行规约

我们将讨论 OpenMP for 循环中的并行规约。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 18 集:其他主题 - 异构系统中的负载平衡

在本视频中,我们将介绍异构系统中的负载平衡。

Authored by Last updated on 04/26/2019 - 04:01
Video

第 7 集:竞态条件和互斥体

我们将讨论使用关键和原子编译时 OpenMP 线程之间的竞态条件和同步。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 9 集:分布式内存并行化和 MPI

在本章上一集中,我们学习了如何使用矢量在每个内核的矢量平面间并行化计算。 然后,我们讨论了如何使用 OpenMP 在每颗处理器或协处理器的内核间扩展应用。 接下来,在本章最后一集 4.9 集中,我们将研究下一级别的并行化:在多台计算设备和集群环境的多个计算节点间扩展。

Authored by Last updated on 04/26/2019 - 04:06
Video

第 8 集:多线程应用中的同步优化

我们继续讨论优化,接下来我们讨论线程并行化的优化。

Authored by Last updated on 04/26/2019 - 03:57
Article

最大限度提升 CPU 上的 TensorFlow* 性能:推理工作负载的注意事项和建议

本文将介绍使用面向 TensorFlow 的英特尔® 优化* 进行 CPU 推理的性能注意事项
Authored by Nathan Greeneltch (Intel) Last updated on 08/09/2019 - 02:02
Article

面向英特尔® 架构优化的 Caffe*:使用现代代码技巧

This paper demonstrates a special version of Caffe* — a deep learning framework originally developed by the Berkeley Vision and Learning Center (BVLC) — that is optimized for Intel® architecture.
Authored by Last updated on 07/06/2019 - 16:40