Article

并行软件优化三步走

提高并行软件的性能需要采用结构化的方法,充分利用开发资源,快速取得出色成效。本文将这种方法划分为三个不同阶段:  

作者: aaron-tersteeg (Intel) 最后更新时间: 2019/07/05 - 10:18
Article

并行优化规划

下载 (英语 PDF, 75KB)

作者: Diana B. (Intel) 最后更新时间: 2019/07/05 - 10:45
博客

最快线程间数据交换算法,有效避免锁竞争 -- TwoQueues

处理多线程数据共享问题注意的几个要点:

1、锁竞争:尽量减少锁竞争的时间和次数。

2、内存:尽量是使用已分配内存,减少内存分配和释放的次数。尽量是用连续内存,减少共享占用的内存量。

多线程数据交换简单方案A:

定义一个list,再所有操作list的地方进行加锁和解锁。

简单模拟代码:

作者: 最后更新时间: 2019/07/04 - 21:30
Article

部分英特尔处理器硬件预取器的发布

部分英特尔处理器硬件预取器的发布

本文发布的 MST 设置可用来控制基于以下微架构的英特尔处理器上可用的各种硬件预取器: Nehalem、Westmere、Sandy Bridge、Ivy Bridge、Haswell 和 Broadwell。

作者: Vish Viswanathan (Intel) 最后更新时间: 2019/07/05 - 20:35
Article

游戏行业的人工智能设计(第一部分)

The gaming industry has seen great strides in game complexity recently. Game developers are challenged to create increasingly compelling games. This series explores important Artificial Intelligence (AI) concepts and how to optimize them for multi-core.
作者: 管理 最后更新时间: 2018/12/12 - 18:00
Article

循环修改增强数据并行性能

When confronted with nested loops, the granularity of the computations that are assigned to threads will directly affect performance. Loop transformations such as splitting and merging nested loops can make parallelization easier and more productive.
作者: 管理 最后更新时间: 2019/07/05 - 14:48
Article

基于英特尔® 架构加速金融应用

下载 PDF

作者: George Raskulinec (Intel) 最后更新时间: 2019/07/06 - 16:40
Article

异构分布式系统上的有限差分

Our building block is the FD compute kernels that are typically used for RTM (reverse time migration) algorithms for seismic imaging. The computations performed by the ISO-3DFD (Isotropic 3-dimensional finite difference) stencils play a major role in accurate imaging of complex subsurface structures in oil and gas surveys and exploration. Here we leverage the ISO-3DFD discussed in [1] and [2] and...
作者: Leonardo B. (Intel) 最后更新时间: 2019/07/06 - 16:40
视频

第 1 集:SIMD 并行化和内联函数

在之前的讲座中,我们已经讨论了英特尔® 至强融核™ 协处理器的目的和架构。 之后,我们研究了面向英特尔至强融核协处理器的编程模型:本机和卸载。 现在我们进入第四章“表达并行化”。 在本章中,我们的目标是学习如何在应用中针对英特尔至强处理器和至强融核协处理器表达数据并行化、线程并行化和进程并行化。

作者: 最后更新时间: 2019/04/26 - 04:05
视频

第 2 集:自动矢量化和数组符号

我们将讨论编译器的自动矢量特性,它可用于哪里以及如何诊断它。 不过今天的讨论只涵盖自动矢量化的基本原则。 在接下来一章的课程中,我们将介绍面向矢量化的代码优化。

作者: 最后更新时间: 2019/04/26 - 04:06