共 1,395 篇文章
共 6,621 篇文章及评论
- Association for Computing Machinery TechNews (ACM)
- Go Parallel! (Dr. Dobbs)
- HPCwire (Tabor Communications, Inc.)
- insideHPC (John West)
- Joe Duffy's Weblog (Microsoft)
- Microsoft Parallel Programming Development Center (Microsoft Germany)
- MultiCoreInfo.com
- scalability.org (Scalable Informatics)
- Software Dev Blog (Intel Germany)
- Soft Talk Blog (Intel United Kingdom)
- The Moth (Microsoft)
Archives
帖子来自 Yang Wang (Intel) 
针对Vxworks的英特尔C++编译器
作者: Yang Wang (Intel) (8 篇文章) 日期: 三月 23, 2011 在 2:10 下午
评论 (0)
日前, 风河宣布将发布世上首个也是唯一支持64位处理器的商用级实时操作系统, Vxworks 6.9. 该操作系统是首个完整支持32位和64位处理的实时操作系统。请参考: http://www.windriver.com/announces/vxworks6.9/ 在最新的Vxworks6.9平台上, ...
分类: 其他
使用#pragma simd进行自动向量化
作者: Yang Wang (Intel) (8 篇文章) 日期: 九月 6, 2010 在 1:25 下午
评论 (0)
#pragma simd 该编译指示(SIMD)是12.0编译器最新提供的功能。他可以强制性的让编译器做自动并行化。 对于其他编译指示比如#pragma ivdep来说, 如果编译器编译时发现用户提供的编译指示条件不满足, 那么编译器是不会根据编译指示来进行自动向量化的。也就是说, 编译器实际上还是会进行编译时的依赖关系检查。 而对于#pargam simd来说, 无论编译时条件如何, ...
分类: Blog Challenge, 并行计算
使用英特尔编译器进行自动向量化
作者: Yang Wang (Intel) (8 篇文章) 日期: 九月 6, 2010 在 1:24 下午
评论 (3)
使用英特尔编译器进行自动向量化 自动向量化是英特尔编译器提供的一个可以自动的使用SIMD指示的功能。 在处理数据时, 编译器自动选择MMX™, Intel® Streaming SIMD 扩展(Intel® SSE, SSE2, ...
分类: Blog Challenge, 并行计算
标签:Auto Vectorization 自动向量化 SIMD SSE 编译指示
SIMD编译指示中的向量化长度的指定
作者: Yang Wang (Intel) (8 篇文章) 日期: 九月 6, 2010 在 1:24 下午
评论 (0)
SIMD编译指示中的向量化长度的指定 SIMD 向量化是英特尔编译器12.0版支持的一个新功能。 该向量化使用 #pragma simd (c/c++) 或者 !DIR$ SIMD(fortran) 编译指示来有效地实现循环向量化。该向量化语法如下所示: #pragma ...
分类: Blog Challenge, 并行计算
支持分布式内存系统的并行开发模式Concurrent Collections (CnC)
作者: Yang Wang (Intel) (8 篇文章) 日期: 七月 7, 2010 在 5:01 下午
评论 (0)
英特尔发布了Concurrent Collections 0.5版本。在这个新版本中提供了一个新的比较吸引人的功能:对分布式内存系统的支持(distCnC)。 现有的大部分并行开发模式都是基于共享内存系统的, 比如openmp, cilk等。 在CnC中实现了对分布式内存系统的支持, 这就允许用户开发一个大型的CnC并行程序并且运行在分布式内存系统中比如用于计算机集群系统。 原则上说, 一个正确运行的共享内存CnC程序同样可以在分布内存CnC中正确的运行。 对于数据的分布几乎完全的被distCnC运行系统内部搞定, ...
分类: 并行计算
Intel® Concurrent Collections (CnC) – 一个新的平行开发模式
作者: Yang Wang (Intel) (8 篇文章) 日期: 七月 5, 2010 在 5:52 下午
评论 (0)
开发多核应用程序的用户一般比较头疼的问题是跟线程相关的问题, 比如程序运行的硬件架构, 线程的同步, 调度与分配,负载平衡等。 某个系统领域内的专家(Domain expert)一般都会专注于程序语义的正确性以及程序本身的一些限制, 所以这些并行相关的问题对于Domain expert来说比较困难。而对于并行系统内的专家(Tuning expert)来说, 由于缺乏对某个领域内专业知识的了解,即使他对并行系统非常了解, ...
分类: 并行计算, 软件开发工具
Intel® Cilk™ Plus 中的工作密取调度
作者: Yang Wang (Intel) (8 篇文章) 日期: 六月 25, 2010 在 10:57 上午
评论 (2)
在Intel® Cilk™ Plus中, 我们可以使用cilk_spawn 来创建一个新的可以并行执行的任务。 从语义上来说, 该新任务是可以与原有任务并行的执行的。 但在实际的运行过程中, 能否并行取决于Intel® Cilk™ ...
分类: 并行计算, 软件开发工具
Intel® Cilk™ Plus 中的 Reducer 视图
作者: Yang Wang (Intel) (8 篇文章) 日期: 六月 25, 2010 在 10:57 上午
评论 (2)
Reducer视图 (The Reducer View) 这里我们来讨论一下Intel® Cilk™ Plus 中的Reducer视图。在Intel® Cilk™ Plus 中, ...
