共 1,394 篇文章
共 6,621 篇文章及评论
- Association for Computing Machinery TechNews (ACM)
- Go Parallel! (Dr. Dobbs)
- HPCwire (Tabor Communications, Inc.)
- insideHPC (John West)
- Joe Duffy's Weblog (Microsoft)
- Microsoft Parallel Programming Development Center (Microsoft Germany)
- MultiCoreInfo.com
- scalability.org (Scalable Informatics)
- Software Dev Blog (Intel Germany)
- Soft Talk Blog (Intel United Kingdom)
- The Moth (Microsoft)
Archives
帖子来自 Hao Jiang (Intel) 
ICC 编译 Google Mock 和 Google Test 的问题
作者: Hao Jiang (Intel) (5 篇文章) 日期: 十二月 23, 2011 在 1:56 下午
评论 (0)
最近发现 Google Test (Google C++ Testing Framework 的非正式称谓) 非常受欢迎,很多公司的研发团队都在使用它编写 C++ ...
分类: 开放源代码, 软件开发工具
标签:12.1, C++ TR1, Google Mock, Google Test, Intel C++
软件工具旧版本的下载链接在哪里?
作者: Hao Jiang (Intel) (5 篇文章) 日期: 五月 17, 2011 在 11:15 上午
评论 (0)
无论你使用哪个英特尔的软件开发工具 (C/C++, Fortran编译器,IPP,MKL,VTune 等等),都可以从英特尔软件注册中心(https://registrationcenter.intel.com)获得最新的更新包。 通常情况下,你可以获得从注册日期开始为期一年的免费升级。当然老的版本依然可以继续使用,而不受到任何限制。 2010年底,英特尔发布了全新的并行开发套件 Parallel Studio XE,并且将各个组件的最新的软件版本号从 11.1 改为了按照年份命名。因此你会发现,注册中心的下载页面上看到的软件版本,缺省就都是 2011 ...
分类: 软件开发工具
标签:下载链接, 旧版本, 注册中心
Co-Array Fortran 看上去很美 ?
作者: Hao Jiang (Intel) (5 篇文章) 日期: 五月 9, 2011 在 3:36 下午
评论 (5)
Co-Array Fortran(下面简称 CAF,中文暂称为”Fortran的集合数组阵列扩展“),最初是作为 Fortran 95 一个小小的扩展,由 Numrich 和 Reid 发表于 ...
分类: 并行计算
标签:Co-array Fortran, Intel Fortran Composer XE
让Windows 7客户端与Samba 服务器正常工作
作者: Hao Jiang (Intel) (5 篇文章) 日期: 十月 29, 2010 在 10:39 上午
评论 (1)
一般很多Linux文件服务器都会开通Samba服务,这样就可以让Windows客户端正常访问了。 最近一台实验机器升级到Windows 7,发现无法正常访问Samba服务器,总是报告登录名或者密码错误。而同样的帐号和密码在XP系统上却能正常访问。 原因是Windows 7升级了缺省的NTLM安全级别,从而无法和原先的Samba服务兼容。 解决的办法是: i) 先打开 Control Panel -> Administrative Tools -> ...
分类: Blog Challenge, 服务器, 软件技术学习及认证
标签:NTLM, Samba, Windows 7
试谈 Cilk™Plus 并行程序性能优化的几个问题
作者: Hao Jiang (Intel) (5 篇文章) 日期: 六月 25, 2010 在 3:31 下午
评论 (0)
性能优化的问题,对于编写Cilk™Plus程序实现并行化也同样重要。 工作密取的调度算法能够帮助Cilk™Plus程序有效地将任务块分配到各个处理器(核)上,从而高效地利用处理器资源。但是如果没有仔细地设计算法,使得整个任务被分成少量的较大任务块,或者大量的小任务块,同样会因为缺乏足够的并行度使得所有处理器保持忙碌状态,或者频繁任务调度带来的大量额外开销,最终导致程序并行的实际效果并不理想。特别是当你使用cilk_spawn时,需要注意避免衍生出大量的小任务块。 通常情况下,Cilk™ Plus程序常见的性能隐患大致会有以下几种: 1) cilk_for的GrainSize设置 英特尔编译器和运行系统会使用一个公式来计算缺省的粒度值。你也可以通过试验不同的粒度值来进行性能调优。 2) 锁竞争 使用锁通常会降低程序并行度而影响性能。 3) 高速缓存的效率和内存带宽 多个核对总线带宽的竞争限定了内存和处理器之间进行数据传输的速度。因此在设计和实现) Cilk™Plus并行程序时,要考虑到高速缓存效率和数据/空间局部性。 4) 内存分配 使用malloc,free,new,或者delete等在堆上分配或释放内存空间时,运行库会使用互斥锁来保护堆数据结构不被破坏。当Cilk™Plus程序中个strand试图同时分配或释放内存空间时,对于锁的竞争会大幅降低程序的并行度。一个可行的解决方法是使用可缩放的内存管理器,比如Intel® Threading Building Block库(TBB)中提供的内存管理器。 5) ...
