Article

借助 SIMD 数据布局模板和数据预处理提高 SIMD 在动画中的使用效率

In this paper, we walk through a 3D Animation algorithm example and describe some techniques and methodologies that may benefit your next vectorization endeavors. We also integrate the algorithm with SIMD Data Layout Templates (SDLT), which is a feature of Intel® C++ Compiler, to improve data layout and SIMD efficiency. Includes code sample.
Authored by Last updated on 03/25/2019 - 11:40
Article

安装英特尔® Theano*软件优化包和支持工具

Theano* is a Python* library developed at the LISA lab to define, optimize, and evaluate mathematical expressions, including the ones with multi-dimensional arrays. Theano can be installed and used with several combinations of development tools and libraries on a variety of platforms. This tutorial provides one such recipe describing steps to build and install Intel-optimized Theano with Intel®...
Authored by Sunny G. (Intel) Last updated on 05/08/2018 - 10:50
Article

如何在英特尔® 至强融核™ 处理器中使用 MPI-3 共享内存

学习如何在英特尔® 至强融核™ 处理器中使用 MPI-3 共享内存
Authored by Nguyen, Loc Q (Intel) Last updated on 10/02/2019 - 15:37
Video

第 3 集:矢量优化 - 数据结构

在这一名为“矢量优化:数据结构”的视频中, 我们将开始讨论面向英特尔至强处理器和英特尔至强融核协处理器的应用中矢量算法的优化。 本讨论包含四集,每一集讨论矢量的不同方面。

Authored by Last updated on 10/15/2019 - 15:50
Video

第 6 集:矢量化 Strip-Mining

作为矢量化计算优化的最后一个主题,我们将讨论一项编程技术,帮助您在复杂情况下向编译器表达向量化机遇。
该技巧称为 strip-mining。 我们现在将使用它将编译器引导至可向量化的计算,同时在接下来的课程中,我们还将使用此技术再次平衡矢量和线程之间的并行化,并将其作为内存优化技术的基础。

Authored by Last updated on 10/15/2019 - 15:50
Video

第 12 集:内存访问优化

在我们之前定义的五个优化领域中,我们讨论了标量优化、矢量优化和多线程优化。 在接下来的硬件子系统中,开发人员在优化流程时必须关注的是内存和高速缓存。
 
目录:
00:08 - 内存访问优化
00:12 - 优化层
00:30 - 内存访问优化为何重要

Authored by Last updated on 10/15/2019 - 15:50
Video

第 18 集:其他主题 - 异构系统中的负载平衡

在本视频中,我们将介绍异构系统中的负载平衡。

Authored by Last updated on 10/15/2019 - 15:50
Video

第 3 集:矢量依赖性、指示器消歧和支持 SIMD 的函数

在本视频中,我们将讨论您在使用英特尔编译器自动矢量化特性时可能会遇到的一些问题。

Authored by Last updated on 10/15/2019 - 15:50
Video

第 1 集:优化路线图

在本集中,我们将介绍“优化路线图”,即最大限度发挥应用性能需采取的步骤。

Authored by Last updated on 10/15/2019 - 15:50
Video

第 4 集:矢量优化 - 对齐和提示

我们继续介绍矢量优化。 在英特尔至强处理器和至强融核协处理器中,实现高效矢量化应考虑的一个重要因素是数据对齐。

Authored by Last updated on 10/15/2019 - 15:50