NUMA与英特尔下一代Xeon处理器学习心得(1)

作者: Bruce Chen 陈宇达 (Intel) (125 篇文章) 日期: 十一月 24, 2008 在 1:27 下午

作为一名工程师,一名做技术的工程师,NUMA也是我的近期工作重点之一。在工作时间,在茶余饭后,也看了些NUMA的资料,学习了英特尔下一代Xeon处理器。这里就是我的一点小结,一点心得,和感兴趣的朋友分享分享。

因时间有限,每次就总结一部分,慢慢道来,欲知详情,下回分晓! :-)

 一、概述

从系统架构来说,目前的主流企业服务器基本可以分为三类:SMP (Symmetric Multi Processing,对称多处理架构)NUMA (Non-Uniform Memory Access,非一致存储访问架构),和MPP (Massive Parallel Processing,海量并行处理架构)。三种架构各有特点,本文将重点聊聊NUMA

 

       为了了解NUMA,我这里就介绍一下NUMA与其他两种Non-NUMA的主要区别。

1SMPSymmetric Multi Processing

       SMP是非常常见的一种架构。在SMP模式下,多个处理器均对称的连接在系统内存上,所有处理器都以平等的代价访问系统内存。它的优点是对内存的访问是平等、一致的;缺点是因为大家都是一致的,在传统的 SMP 系统中,所有处理器都共享系统总线,因此当处理器的数目增多时,系统总线的竞争冲突迅速加大,系统总线成为了性能瓶颈,所以目前 SMP 系统的处理器数目一般只有数十个,可扩展性受到很大限制。

 

2MPP (Massive Parallel Processing)

       MPP则是逻辑上将整个系统划分为多个节点,每个节点的处理器只可以访问本身的本地资源,是完全无共享的架构。节点之间的数据交换需要软件实施。它的优点是可扩展性非常好;缺点是彼此数据交换困难,需要控制软件的大量工作来实现通讯以及任务的分配、调度,对于一般的企业应用而言过于复杂,效率不高。

 

3NUMANon-Uniform Memory Access

       NUMA架构则在某种意义上是综合了SMPMPP的特点:逻辑上整个系统也是分为多个节点,每个节点可以访问本地内存资源,也可以访问远程内存资源,但访问本地内存资源远远快于远程内存资源。它的优点是兼顾了SMPMPP的特点, 易于管理,可扩充性好;缺点是访问远程内存资源的所需时间非常的大。

 

       在实际系统中使用比较广的是SMPNUMA架构。像传统的英特尔IA架构就是SMP,而很多大型机采用了NUMA架构。

      

       现在已经进入了多核时代,随着核数的越来越多,对于内存吞吐量和延迟有了更高的要求。正是考虑到这种需求,NUMA架构出现在了最新的英特尔下一代Xeon处理器中。

 

 

(本系列已经告一段落,这里就小结一下,本主题更多内容请见:
http://softwareblogs-zho.intel.com/2009/02/01/numaxeon10/
http://software.intel.com/zh-cn/blogs/2009/01/22/numaxeon9/
http://softwareblogs-zho.intel.com/2009/01/07/numaxeon8/
http://software.intel.com/zh-cn/blogs/2008/12/23/numaxeon7/
http://software.intel.com/zh-cn/blogs/2008/12/22/numaxeon6/
http://softwareblogs-zho.intel.com/2008/12/08/numaxeon5/
http://softwareblogs-zho.intel.com/2008/12/05/numaxeon4/
http://softwareblogs-zho.intel.com/2008/12/03/numaxeon3/
http://softwareblogs-zho.intel.com/2008/11/28/numaxeon2/
http://software.intel.com/zh-cn/blogs/2008/11/24/numaxeon1/
http://software.intel.com/zh-cn/blogs/2008/10/21/numa/
分类: 其他, 并行计算

如需了解英特尔软件产品相关的性能和优化选项,请参阅优化注意事项.

 评论 (49)

2008年11月25日 12:23

gaohuzi
gaohuzi
我是一个机
2008年11月25日 16:07


星月部落
应该是个好事情啊!呵呵
2008年11月26日 14:16

Wang Ping 王平 (Intel)
Wang Ping 王平 (Intel)总分:
9,766
社区经理
非常全面的学习心得, 跟着一起学了
2008年11月27日 08:09


gavinlimliu
跟着一起学,前进!
2008年11月27日 10:10


中国护士考试网
想找女朋友或老婆的,请来 中国护士考试网

http://512test.com/bbs/index.php
2008年11月27日 19:01


学习
一起学习
2008年11月27日 23:40

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
多谢支持,继续!
2008年11月28日 13:02


wzh
2008年11月28日 20:05


wxgwz
学习啊
2008年11月28日 20:10

sunny0104
sunny0104总分:
125
注册用户
准备入正题
2008年12月01日 10:31

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
正题请见后续文字 :-)
2008年12月03日 10:26


AC
什么NUMA,SMP的,我是基础程序员,你只站在你的高度往上看
2008年12月03日 11:16

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
呵呵,程序员还是需要了解的
2008年12月03日 14:56


gstsdyrmyy
我是新手,愿向你学习
2008年12月03日 14:58

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
不客气,互相探讨探讨
2008年12月03日 20:10


tianciccnu
学海无涯啊!汗!
什么时候自己才能发点文章!o(∩_∩)o...哈哈
2008年12月04日 08:35

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
没办法,入了这个行当,想不学也不行啊。
欢迎欢迎,有什么心得多发多发
2008年12月05日 07:42

chengchao0324tom.com
chengchao0324tom.com总分:
10
注册用户
跟着学习,多谢
2008年12月05日 14:49


zddandan
顶·南粤招聘网 http://www.jobe23.com QQ853998641 020-22855608
2008年12月05日 14:52

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
后面还有 :-)
2008年12月05日 23:39


oberon
你要是去看看top500 list, (http://www.top500.org) 就会发现上面几乎都是mpp,偶尔有点numa,smp?算了吧。。。
2008年12月06日 10:43

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
在大型应用的HPC领域,的确是SMP、NUMA相对少些。但对于一般的企业/个人应用来说,也是不能放到HPC的框架来进行的。各有侧重 吧
2008年12月06日 12:42


sxqq
对比分析清晰,对我很有帮助。因为我主要是从事软件这块,对硬解相对有限,但我对硬件相关的内宾也非常感兴趣
2008年12月06日 13:09


dudu1899
谢谢LZ,新生入门,有点了解。
2008年12月06日 14:37


pingandqu
站在高手面前,真是幸运!
2008年12月06日 22:27


Rock.C
MPP是指分布式系统吗?
2008年12月08日 09:06

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
MPP应该说是分布式系统的一种。分布式系统有很多的表现形式,MPP是其中之一。就像提起Linux操作系统,有很多的不同的发行厂家和 版本,Redhat、SuSE、Redflag。。。
2008年12月08日 09:12

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
一起学,也是在学习中,不是高手,呵呵
2008年12月08日 14:25


加密狗
路过,支持下120423252
2008年12月08日 14:35

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
欢迎参与讨论
2008年12月18日 12:04


baal
AMD 的这个功能比intel更强劲!!
http://www.sula.cn
2008年12月18日 12:10


四维
学习了!!!!!
2008年12月18日 20:12


很好很强大
虽然不是很懂,不过顶哈!
2008年12月19日 10:55

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
呵呵,多讨论,多讨论
2008年12月19日 10:58


王刚
Intel真n
对于SMP和numa的理解,我还停留以为是大型计算机的技术呢,
没想到,都已经到了单个CPU需要考虑的地步了。
那,真是没治了,以后是不是单个CPU里面都能集成了集群计算了?
哦,好像片上电源管理,都已经弄好了,那不就等于差不多是集群了?
强大,太强大了。
我期待,能够把所有部件集成到一块儿芯片上,只留一种输入输出方式,类似于蓝牙的那种,
到那时候,再解决了芯片能源问题,我第一个要求植入体内。
2008年12月22日 08:50

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
我要是也说Intel牛就怕有自卖自夸的嫌疑了,呵呵。从这个意义上讲,真的是单个CPU都是集群了。
不过我个人对把芯片集成到人体还是很害怕的。记得前几天看了部电影,就是说科技太发达了,人完全不需要做什么,也就彻底退化了。就好比现在 交通工具和机械很发达,人的体能就退化了,爬山对很多人来讲已经是奢侈了,前景很可怕
2008年12月22日 09:34


英特尔® 软件网络博客 - 中文 » 进步的科技,退化的人
[...] XP之经验谈邪恶的韩国UMPC|UMID CLAMSHELL 更多图片 3G来了!! --2 (硬件篇)NUMA与英特尔下一代Xeon处理器学习心得(1)“老子”是伟大的多核计算科学家 [...]
2008年12月24日 17:02


小林
学习了!
2008年12月24日 19:51


孩子
汗颜,看不懂!
2008年12月29日 16:43

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
呵呵,多看几遍就没问题了

新年快乐!
2009年01月22日 03:02


蜜蜂
二房热他日个日
2009年01月22日 03:02


蜜蜂
酷热合乎然后绒裤后赶快然后开会客人后果
2009年03月20日 03:45

spearous
spearous总分:
15
注册用户
发热和功率问题。。。
2009年04月21日 19:26

Peng Huang
Peng Huang总分:
60
注册用户
要看实现的代价是否高,如果性价比低的话,那还是鸡肋啊!
2009年04月23日 23:04

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
说得好。这就需要事先做一个概括的分析和估计,看应用的内存使用模式是怎么样的。有的应用的确对内存分布不敏感,但也的确有些应用的内存使 用模式不是分散的,调节成跟NUMA很配,性能提升很大的。
2009年08月29日 01:22

ericxieforever
ericxieforever总分:
120
绿带
现在做个程序员真是不容易,多核情况下,体系对于程序员而言不再是透明的了。。。
2009年08月29日 03:40

Bruce Chen 陈宇达 (Intel)
Bruce Chen 陈宇达 (Intel)总分:
11,055
黑带
同感,干什么都不容易啊

 引用 (1)


 写评论  

欲获得技术支持,请访问软件支持页面.
姓名 (必填)*

电子邮件 (必填,不在本页面显示)*

您的 URL (可选)


评论*