Filtros

Mensajes en el blog

Intel MKL函数,如何得到相同的计算结果?

在运行程序时,我们总希望多次运行的结果,是完全一致,甚至在不同的机器与不同的OS中,程序运行的结果每一位都完全相同。

Autor Chao Y (Intel) Última actualización 14/06/2017 - 15:53
Mensajes en el blog

Intel MKL 多线程设置

对于多核程序,多线程对于程序的性能至关重要。 下面,我们将对Intel MKL 有关多线程方面的设置做一些介绍: 我们提到MKL 支持多线程,它包括的两个概念:

Autor Chao Y (Intel) Última actualización 14/06/2017 - 15:56
Mensajes en el blog

Intel Optimized LINPACK Benchmark 性能测试

Linpack是我们常用的CPU性能测试程序。它通过计算双精度线性方程组的求解来测试CPU的运算能力。Intel MKL提供一个优化版本的Intel® Optimized LINPACK Benchmark,通过运行这个程序,我们可以方便进行CPU的基准性能测试。

Autor Chao Y (Intel) Última actualización 14/06/2017 - 15:57
Mensajes en el blog

通过FFTW Wrapper 使用 MKL DFT 函数

 提起FFT/DFT计算,我们会常常想起两个函数库:FFTW 与Intel MKL.  FFTW 提供一个广为流行关于FFT计算的函数接口。 现有的许多应用,就是基于了FFTW接口的调用。 而Intel MKL 是一个高度优化的数学计算函数。对于一些常用的计算函数,如矩阵运算,方程求解,随机数生成等, 它提供了高性能,对不同平台专门优化的代码。

Autor Chao Y (Intel) Última actualización 14/06/2017 - 15:54
Article

多线程架构上的实时深海模拟

多线程架构上的实时深海模拟
Autor Adam Lake (Intel) Última actualización 31/01/2019 - 11:42
Mensajes en el blog

Intel MKL 稀疏矩阵求解PARDISO 函数

  Intel MKL提供了针对稀疏矩阵求解的PARDISO 接口,它是在共享内存机器上,实现的稀疏矩阵的直接求解方法,对于一些大规模的计算问题, PARDISO的算法表现了非常好的计算效率与并行性。一些数值测试表明,随着计算节点数目增加, PARDISO具有接近线性的加速比例。  PARDISO对应求解过程包括如下步骤:
Autor Chao Y (Intel) Última actualización 14/06/2017 - 15:53
Article

 英特尔® 处理器显卡

英特尔处理器显卡经历不同世代而更新。 本页面详细讨论英特尔® 处理器显卡,包括最新的英特尔显卡开发人员指南,以及前几代英特尔显卡开发人员指南。
Autor admin Última actualización 10/03/2019 - 22:08
Article

无需控制 NUMA 共享内存策略即可在基于 NUMA 的 Nehalem-EX 系统上获得较高性能

简介

默认在 Nehalem-EX 上执行的传统 MKL 性能测试中有很多 MKL LAPACK 函数的性能都较低,尤其是 DGETRF。经检测发现,同样的系统在 Linux 下使用诸如 numactll 之类的实用程序(即控制 NUMA 共享内存策略)性能将获得显著提升,即用以下方式启动应用:

Autor Michael Chuvelev (Intel) Última actualización 07/06/2017 - 09:27
Article

利用英特尔® 线程构建模块(英特尔® TBB)优化 MSC. Software SimXpert*

MSC.Software SimXpert* is a fully integrated simulation environment for performing multidiscipline based analysis with a graphical interface designed to facilitate the end-to-end simulations. This article describes the threading of SimXpert.
Autor Última actualización 01/08/2019 - 09:30
Article

利用英特尔® SIMD 流指令扩展和英特尔® 高级矢量扩展指令集的图像处理加速技术

This article details optimized implementations of data transformations and algorithms together with analysis comparing performance and providing speedup measurements for Intel® SSE optimized code and estimates for Intel® AVX optimized code.
Autor Larsson, Petter (Blackbelt) Última actualización 25/05/2018 - 15:30