共 1,393 篇文章
共 6,621 篇文章及评论
- Association for Computing Machinery TechNews (ACM)
- Go Parallel! (Dr. Dobbs)
- HPCwire (Tabor Communications, Inc.)
- insideHPC (John West)
- Joe Duffy's Weblog (Microsoft)
- Microsoft Parallel Programming Development Center (Microsoft Germany)
- MultiCoreInfo.com
- scalability.org (Scalable Informatics)
- Software Dev Blog (Intel Germany)
- Soft Talk Blog (Intel United Kingdom)
- The Moth (Microsoft)
NUMA与英特尔下一代Xeon处理器学习心得(1)
作者: Bruce Chen 陈宇达 (Intel) (125 篇文章) 日期: 十一月 24, 2008 在 1:27 下午
作为一名工程师,一名做技术的工程师,NUMA也是我的近期工作重点之一。在工作时间,在茶余饭后,也看了些NUMA的资料,学习了英特尔下一代Xeon处理器。这里就是我的一点小结,一点心得,和感兴趣的朋友分享分享。
因时间有限,每次就总结一部分,慢慢道来,欲知详情,下回分晓!
一、概述
从系统架构来说,目前的主流企业服务器基本可以分为三类:SMP (Symmetric Multi Processing,对称多处理架构),NUMA (Non-Uniform Memory Access,非一致存储访问架构),和MPP (Massive Parallel Processing,海量并行处理架构)。三种架构各有特点,本文将重点聊聊NUMA。
为了了解NUMA,我这里就介绍一下NUMA与其他两种Non-NUMA的主要区别。
1.SMP(Symmetric Multi Processing)
SMP是非常常见的一种架构。在SMP模式下,多个处理器均对称的连接在系统内存上,所有处理器都以平等的代价访问系统内存。它的优点是对内存的访问是平等、一致的;缺点是因为大家都是一致的,在传统的 SMP 系统中,所有处理器都共享系统总线,因此当处理器的数目增多时,系统总线的竞争冲突迅速加大,系统总线成为了性能瓶颈,所以目前 SMP 系统的处理器数目一般只有数十个,可扩展性受到很大限制。
2.MPP (Massive Parallel Processing)
MPP则是逻辑上将整个系统划分为多个节点,每个节点的处理器只可以访问本身的本地资源,是完全无共享的架构。节点之间的数据交换需要软件实施。它的优点是可扩展性非常好;缺点是彼此数据交换困难,需要控制软件的大量工作来实现通讯以及任务的分配、调度,对于一般的企业应用而言过于复杂,效率不高。
3.NUMA(Non-Uniform Memory Access)
NUMA架构则在某种意义上是综合了SMP和MPP的特点:逻辑上整个系统也是分为多个节点,每个节点可以访问本地内存资源,也可以访问远程内存资源,但访问本地内存资源远远快于远程内存资源。它的优点是兼顾了SMP和MPP的特点, 易于管理,可扩充性好;缺点是访问远程内存资源的所需时间非常的大。
在实际系统中使用比较广的是SMP和NUMA架构。像传统的英特尔IA架构就是SMP,而很多大型机采用了NUMA架构。
现在已经进入了多核时代,随着核数的越来越多,对于内存吞吐量和延迟有了更高的要求。正是考虑到这种需求,NUMA架构出现在了最新的英特尔下一代Xeon处理器中。
(本系列已经告一段落,这里就小结一下,本主题更多内容请见:
http://softwareblogs-zho.intel.com/2009/02/01/numaxeon10/
http://software.intel.com/zh-cn/blogs/2009/01/22/numaxeon9/
http://softwareblogs-zho.intel.com/2009/01/07/numaxeon8/
http://software.intel.com/zh-cn/blogs/2008/12/23/numaxeon7/
http://software.intel.com/zh-cn/blogs/2008/12/22/numaxeon6/
http://softwareblogs-zho.intel.com/2008/12/08/numaxeon5/
http://softwareblogs-zho.intel.com/2008/12/05/numaxeon4/
http://softwareblogs-zho.intel.com/2008/12/03/numaxeon3/
http://softwareblogs-zho.intel.com/2008/11/28/numaxeon2/
http://software.intel.com/zh-cn/blogs/2008/11/24/numaxeon1/
http://software.intel.com/zh-cn/blogs/2008/10/21/numa/)
分类: 其他, 并行计算
如需了解英特尔软件产品相关的性能和优化选项,请参阅优化注意事项.
评论 (49)
| 2008年11月25日 16:07
星月部落 | 应该是个好事情啊!呵呵 |
| 2008年11月26日 14:16
Wang Ping 王平 (Intel)
| 非常全面的学习心得, 跟着一起学了 |
| 2008年11月27日 08:09
gavinlimliu | 跟着一起学,前进! |
| 2008年11月27日 10:10
中国护士考试网 |
想找女朋友或老婆的,请来 中国护士考试网 http://512test.com/bbs/index.php |
| 2008年11月27日 19:01
学习 | 一起学习 |
| 2008年11月27日 23:40
Bruce Chen 陈宇达 (Intel)
| 多谢支持,继续! |
| 2008年11月28日 13:02
wzh |
| 2008年11月28日 20:05
wxgwz | 学习啊 |
| 2008年11月28日 20:10
sunny0104
| 准备入正题 |
| 2008年12月01日 10:31
Bruce Chen 陈宇达 (Intel)
| 正题请见后续文字 :-) |
| 2008年12月03日 10:26
AC | 什么NUMA,SMP的,我是基础程序员,你只站在你的高度往上看 |
| 2008年12月03日 11:16
Bruce Chen 陈宇达 (Intel)
| 呵呵,程序员还是需要了解的 |
| 2008年12月03日 14:56
gstsdyrmyy | 我是新手,愿向你学习 |
| 2008年12月03日 14:58
Bruce Chen 陈宇达 (Intel)
| 不客气,互相探讨探讨 |
| 2008年12月03日 20:10
tianciccnu |
学海无涯啊!汗! 什么时候自己才能发点文章!o(∩_∩)o...哈哈 |
| 2008年12月04日 08:35
Bruce Chen 陈宇达 (Intel)
|
没办法,入了这个行当,想不学也不行啊。 欢迎欢迎,有什么心得多发多发 |
| 2008年12月05日 07:42
chengchao0324tom.com
| 跟着学习,多谢 |
| 2008年12月05日 14:49
zddandan | 顶·南粤招聘网 http://www.jobe23.com QQ853998641 020-22855608 |
| 2008年12月05日 14:52
Bruce Chen 陈宇达 (Intel)
| 后面还有 :-) |
| 2008年12月05日 23:39
oberon | 你要是去看看top500 list, (http://www.top500.org) 就会发现上面几乎都是mpp,偶尔有点numa,smp?算了吧。。。 |
| 2008年12月06日 10:43
Bruce Chen 陈宇达 (Intel)
| 在大型应用的HPC领域,的确是SMP、NUMA相对少些。但对于一般的企业/个人应用来说,也是不能放到HPC的框架来进行的。各有侧重 吧 |
| 2008年12月06日 12:42
sxqq | 对比分析清晰,对我很有帮助。因为我主要是从事软件这块,对硬解相对有限,但我对硬件相关的内宾也非常感兴趣 |
| 2008年12月06日 13:09
dudu1899 | 谢谢LZ,新生入门,有点了解。 |
| 2008年12月06日 14:37
pingandqu | 站在高手面前,真是幸运! |
| 2008年12月06日 22:27
Rock.C | MPP是指分布式系统吗? |
| 2008年12月08日 09:06
Bruce Chen 陈宇达 (Intel)
| MPP应该说是分布式系统的一种。分布式系统有很多的表现形式,MPP是其中之一。就像提起Linux操作系统,有很多的不同的发行厂家和 版本,Redhat、SuSE、Redflag。。。 |
| 2008年12月08日 09:12
Bruce Chen 陈宇达 (Intel)
| 一起学,也是在学习中,不是高手,呵呵 |
| 2008年12月08日 14:25
加密狗 | 路过,支持下120423252 |
| 2008年12月08日 14:35
Bruce Chen 陈宇达 (Intel)
| 欢迎参与讨论 |
| 2008年12月18日 12:04
baal |
AMD 的这个功能比intel更强劲!! http://www.sula.cn |
| 2008年12月18日 12:10
四维 | 学习了!!!!! |
| 2008年12月18日 20:12
很好很强大 | 虽然不是很懂,不过顶哈! |
| 2008年12月19日 10:55
Bruce Chen 陈宇达 (Intel)
| 呵呵,多讨论,多讨论 |
| 2008年12月19日 10:58
王刚 |
Intel真n 对于SMP和numa的理解,我还停留以为是大型计算机的技术呢, 没想到,都已经到了单个CPU需要考虑的地步了。 那,真是没治了,以后是不是单个CPU里面都能集成了集群计算了? 哦,好像片上电源管理,都已经弄好了,那不就等于差不多是集群了? 强大,太强大了。 我期待,能够把所有部件集成到一块儿芯片上,只留一种输入输出方式,类似于蓝牙的那种, 到那时候,再解决了芯片能源问题,我第一个要求植入体内。 |
| 2008年12月22日 08:50
Bruce Chen 陈宇达 (Intel)
|
我要是也说Intel牛就怕有自卖自夸的嫌疑了,呵呵。从这个意义上讲,真的是单个CPU都是集群了。 不过我个人对把芯片集成到人体还是很害怕的。记得前几天看了部电影,就是说科技太发达了,人完全不需要做什么,也就彻底退化了。就好比现在 交通工具和机械很发达,人的体能就退化了,爬山对很多人来讲已经是奢侈了,前景很可怕 |
| 2008年12月22日 09:34
英特尔® 软件网络博客 - 中文 » 进步的科技,退化的人 | [...] XP之经验谈邪恶的韩国UMPC|UMID CLAMSHELL 更多图片 3G来了!! --2 (硬件篇)NUMA与英特尔下一代Xeon处理器学习心得(1)“老子”是伟大的多核计算科学家 [...] |
| 2008年12月24日 17:02
小林 | 学习了! |
| 2008年12月24日 19:51
孩子 | 汗颜,看不懂! |
| 2008年12月29日 16:43
Bruce Chen 陈宇达 (Intel)
|
呵呵,多看几遍就没问题了 新年快乐! |
| 2009年01月22日 03:02
蜜蜂 | 二房热他日个日 |
| 2009年01月22日 03:02
蜜蜂 | 酷热合乎然后绒裤后赶快然后开会客人后果 |
| 2009年03月20日 03:45
spearous
| 发热和功率问题。。。 |
| 2009年03月31日 00:50
Jeff Zhang 张炯 (Intel)
|
本主题更多内容请见: http://softwareblogs-zho.intel.com/2009/02/01/numaxeon10/ http://software.intel.com/zh-cn/blogs/2009/01/22/numaxeon9/ http://softwareblogs-zho.intel.com/2009/01/07/numaxeon8/ http://software.intel.com/zh-cn/blogs/2008/12/23/numaxeon7/ http://software.intel.com/zh-cn/blogs/2008/12/22/numaxeon6/ http://softwareblogs-zho.intel.com/2008/12/08/numaxeon5/ http://softwareblogs-zho.intel.com/2008/12/05/numaxeon4/ http://softwareblogs-zho.intel.com/2008/12/03/numaxeon3/ http://softwareblogs-zho.intel.com/2008/11/28/numaxeon2/ http://software.intel.com/zh-cn/blogs/2008/11/24/numaxeon1/ http://software.intel.com/zh-cn/blogs/2008/10/21/numa/ |
| 2009年04月21日 19:26
Peng Huang
| 要看实现的代价是否高,如果性价比低的话,那还是鸡肋啊! |
| 2009年04月23日 23:04
Bruce Chen 陈宇达 (Intel)
| 说得好。这就需要事先做一个概括的分析和估计,看应用的内存使用模式是怎么样的。有的应用的确对内存分布不敏感,但也的确有些应用的内存使 用模式不是分散的,调节成跟NUMA很配,性能提升很大的。 |
| 2009年08月29日 01:22
ericxieforever
| 现在做个程序员真是不容易,多核情况下,体系对于程序员而言不再是透明的了。。。 |
| 2009年08月29日 03:40
Bruce Chen 陈宇达 (Intel)
| 同感,干什么都不容易啊 |
引用 (1)
- 快速判断是否NUMA架构下远端内存访问过多 – 英特尔® 软件网络博客 - 中文
2010年10月26日 23:20





gaohuzi