3 匹配结果
Article

利用256位英特尔®高级矢量扩展指令集(英特尔®AVX)实现3D矢量标准化

本文描述了如何利用256位英特尔® 高级矢量扩展指令集(英特尔® AVX)实现3D矢量数组的标准化。此外,我们还介绍了在AOS和SOA之间进行动态转换,让数据用于8-wide单指令多数据(SIMD)处理的乱序方法。从8x3到3x8的转置可通过5个乱序操作来实现,而从3x8到8x3的转置则需要6个乱序操作。结果表明,使用更宽的SIMD执行标准化计算具备显著的优势,采用128位和256位版本可分别将计算速度提高2.3和2.9倍。支持SOA处理的双向转置开销非常低(11 个额外指令),适合用于此类小型计算
作者: Stan Melax (Intel) 最后更新时间: 2014/11/13 - 20:53
Article

在不编写 AVX 代码的情况下使用 AVX

Using AVX Without Writing AVX Code (PDF 260KB)

作者: admin 最后更新时间: 2013/09/06 - 18:26
Article

使用英特尔® 软件开发仿真器的优势

简介

全新的英特尔处理器引入了增强型扩展指令集,以此提升应用的性能或增强其安全性。  英特尔 AVX1 和 AVX21 等扩展指令集主要用于提升性能,而英特尔 SHA2 指令则用于 SHA 加速,从而增强应用的安全性。

作者: tianhui s. 最后更新时间: 2015/05/19 - 22:34
有关编译器优化的更完整信息,请参阅优化通知