| 2009年04月12日 10:00 | |
浅谈并行编程中的任务分解模式
并行编程使用线程来使得多个操作能够同时运行。并行编程主要包括应用程序中线程设计,开发和部署以及线程间相互协调和各自的操作。
在下文中我们将讨论怎样分割适合线程化大小的编程任务来多任务化一个应用程序。
设计线程
不熟悉并行编程的开发者通常对例如面向对象的传统的编程模式感到非常适应。在传统的编程模式下,程序以预先定义的起点开始运行,譬如main函数,然后接连地做完一系列任务。如果程序依赖用户交互,主要的工作代码通常被封装在一个处理用户事件的循环里。
从一个约定事件开始,譬如点击按钮,程序运行一段已经制定的顺序行为,最终以等待用户下个动作结束。
当设计这样的程序时,程序员喜欢一个相对简单的编程模式因为在任意一段给定的时间内只有一个事件发生。如果程序任务必须按某种方式顺序运行, 程序员必须在这些事件上特意安排顺序。在这个过程的任一时刻,程序运行一步接着下一步,最终基于预先确定的参数到达一个预见的结果。
从这种线性的模式到并行编程模式,程序设计者必须重新思考程序的过程流。相比顺序执行序列限制,程序员应该识别出那些能被并行化的行为。
要这样做,他们必须把程序看作一组相互间有依赖关系的任务。把程序分解成一些独立的任务并识别这些任务间的依赖性。这个过程被称为分解。
一个问题有许多分解方式: 按任务,数据,或者按数据流。下面的表总结了这些分解的形式。您将很快看到,这些不同分解形式对应了不同的编程行为。
|
分解类型 |
设计 |
评论 |
|
任务 |
不同的行为分配给不同的线程 |
通常在GUI应用 |
|
数据 |
多个线程对不同的数据集执行同样的操作 |
通常在音频处理,做图和科学编程 |
|
数据流 |
一个线程的输出是第二个线程的输入 |
需要特别关注消除开始和结束的延迟 |
主要的分解形式总结
任务分解
按功能分解一个程序被称为任务分解。这是一种实现并行执行最简单的方式。使用这种方法,每个任务被按目录分类。
如果它们中的两个能同时运行,它们会被程序员按此调度。以这种方式并行运行任务通常需要对每个函数做小量修改来避免冲突,并指出这些任务已经不再连续。
以园艺工作举例,任务分解会建议园丁按工作本身的属性分配任务:如果两个园丁到达一个客户家,一个修剪草坪,另一个铲除杂草。修剪草坪和铲除杂草是两个被分开的功能。
要完成这两个功能,园丁们需要确保他们之间相互协调,这样铲除杂草的园丁就不会坐在待修剪草坪的中间。
举个编程的例子,一个任务分解的典型案例是文字处理软件,譬如微软的Word。当用户打开一个很长的文档的时候,他(她)能够马上开始输入文字。当用户输入文字时,文档分页在后台发生,于是他(她)能够很容易地看到状态栏中页数的增加。
文档输入和分页是两个独立的任务,程序员按功能将它们分开来并行运行。如果程序员没有这样设计,用户将不得不在能够输入任何文字之前等待整个文档被分页。有些朋友可能回忆起这种现象在早期的个人电脑文字处理器中非常常见。
数据分解
数据分解,也被认为是数据级并行,将任务按它们处理的数据进行分解,而不是按照任务本身的性质。使用数据分解的程序通常有许多线程在执行同样的任务,只是处理的数据项不同。
举个例子,假设在一个大的电子数据表里计算值。相比一个线程执行所有的计算,数据分解会建议有两个线程,每个执行一半的计算量,或者n个线程执行1/n的工作量。
如果园丁应用数据分解来分解他们的任务,他们两个会同时修剪一半的草坪,然后两个人分别铲除一半的杂草。在计算领域,决定哪一种分解形式更高效取决于系统的限制。
举例说,如果需要修剪草坪的地块非常小以至于没必要有两个人来修剪草坪,修剪草坪这个任务最好只被分配给一个园丁做,那么任务分解在这一步是最好的选择。数据分解或许适用于其它的任务序列,譬如当修剪草坪完成后,两个园丁并行地来铲除杂草。
随着处理器核心数目的增加,数据分解使得任务处理规模增加。这允许在同样的时间内做更多的工作。
举园丁的例子,假设有另外两个园丁加入了工作。相比分配所有四个园丁到一个地块工作,我们不如分配两个新的园丁去另一个地块,非常有效地增加我们总的任务处理量。
假设两位新园丁和两位老园丁能够做同样多的工作,两个地块的大小也是一样的,我们已经在同样的时间内把工作量翻倍了。
数据流分解
许多时候,当分解一个问题时,关键不是任务应该做什么事情,而是数据在不同任务中怎样传递。在这些情况下,数据流分解将问题按数据在任务中传递的方式来分解。
生产者/消费者问题是数据流影响程序并行执行能力的著名例子。这里,一个生产者任务的输出,成为另一个消费者的输入。两个任务被不同的线程执行,直到生产者完成他的部分工作,消费者不能开始工作。
依然引用园丁的例子,一个园丁准备工具,譬如他承担为割草机加油,清扫剪刀等类似的任务来提供这些工具给另两个园丁使用。直到这个准备步骤基本结束,其他园丁的园艺工作才能开始。
由第一个任务引起的延迟为第二个任务产生一个暂停,在此之后两个任务才能并行运行。在计算机领域这样的模式经常发生。
在常见的编程任务里,生产者/消费者问题在多个典型的场景发生。譬如,必须对读文档做回应的程序就符合这种场景:文件的输入/输出结果成为下一步可能被线程化的工作的输入。下一步直到读完或读到其他处理需要的足够信息才会开始执行。另一个编程的例子是分析:一个输入文件必须在后端操作之前被分析或者语义分析,譬如编译器的代码生成。
生产者/消费者问题有许多需要注意的方面:
1) 如果这种模式没有正确地执行,消费者和生产者间产生的依赖性会引起重大的延迟。一个性能敏感的设计需要充分理解依赖关系的性质以减小延迟的影响。这也是为了避免消费者线程空闲等待生产者线程的情况。
2) 在完美的情况下,生产者和消费者间的传递是完全"清洁"的,就像在文件分析器的例子中一样。输出是上下文相关的,消费者不需要知道生产者的任何事情。然而在很多时候,生产者和消费者并不享受如此干净的任务分割,安排他们间的互动需要非常仔细的计划。
3) 如果当生产者完全做好后消费者开始加工,那么当其他线程忙着工作时一个线程就保持空闲。这个问题破坏了一个并行处理的重要目标,那就是负载均衡以使得所有能用的线程保持忙碌。由于线程间的逻辑关系,要保持线程平等地被占用非常困难。
下面,我们看看流水线模式,它允许开发者以可升级的模式解决生产者/消费者问题。
不同分解的含义
不同的分解具有不同的优势。如果目标是使编程简便,任务能够清楚地按功能分割,那么任务分解通常更合适。
数据分解增加了一些额外的代码级复杂度,因此他专供数据非常容易分解而性能又非常重要的情况使用。
线程化程序的最常见原因就是性能。在这种情况下,分解方式的选择就更加困难。在许多情况下,选择依赖于问题的领域:一些任务明显更适合于其中一种分解方式。
但是一些任务没有明显的偏向。譬如视频流中的图像处理。在帧与帧间没有依赖的格式,你需要作出分解模式的选择。他们应该选择任务分解么,那样一个线程解码,另一个线程配色,诸如此类?或者选择数据分解,每个线程做一帧上的所有工作,然后一起开始处理新的一帧?
回到园丁的例子:如果两个园丁需要修整两块草坪和铲除两块花园的杂草,他们应该怎样工作?是应该一个园丁只修剪草坪,也就是他们选择基于任务的分解呢?还是两个人应该同时修剪草坪然后同时铲除杂草?
在一些情况下,答案很快显现。例如当一个资源限制存在,譬如只有一个割草机。其它情况下每一个园丁都有一个割草机,答案只能通过仔细分析行为要素来得出。在园丁的例子中,任务分解看起来更好,因为如果只有一个割草机在使用,开始的割草时间就被节省了。
最终,你通过仔细的计划和测试来为你的应用程序使用并行编程作出正确的选择。 根据经验估计在你决定并行程序设计时比标准的单线程编程中扮演更加重要的角色。
你将面对的挑战
使用线程通过允许两个或多个行为同时发生使得你显著改进性能。然而,开发者不能不认识到线程增加了复杂性度量,需要细致的考虑来正确引导。
这种复杂度源于程序中多于一个行为发生的自身性质。管理同步行为和他们可能的交互使你面对下面四种问题:
1) 同步是两个或多个线程协调他们行为的过程。譬如,一个线程在继续运行前等待另一个完成任务。
2) 交互代表与线程间交换数据相关的带宽和延迟问题。
3) 负载均衡表示任务在多个线程间的分配,因此他们都处理基本同样的工作量。
4) 可扩展性是当软件在更先进的系统上运行时高效利用许多线程的挑战。譬如,如果一个程序被编写来充分利用四核处理器,当它在一个八核处理器上运行时它是否能适当地扩展?
上述每个问题都必须被仔细地处理来最大化程序的性能。
并行编程模式
对于多年编写面向对象程序的程序员,他们使用设计模式来逻辑地设计他们的应用程序。并行编程和面向对象编程没有什么不同,并行编程问题通常对应于许多知名的编程模式之一。
下面的表格显示了一些常见的并行编程模式和他们对应的上述分解类型。
|
模式 |
分解 |
|
任务级并行 |
任务 |
|
分离并战胜 |
任务/数据 |
|
几何分解 |
数据 |
|
流水线 |
数据流 |
|
波阵面 |
数据流 |
常见的并行编程模式
在这部分,我们将提供每种模式及其适用的问题种类的简要概述,包括:
1) 任务级并行编程模式。在许多情况下,完成并行执行的最佳方法是直接关注任务本身。在这种情况下,任务级并行模式最合适。这种模式下,问题被分解成一组独立操作的任务。
通常移除任务间的依赖性或使用复制来分离依赖性是必要的。适合这种模式的问题包括线程间没有依赖性,或线程间的依赖性可从每一个线程中移除。
2) 分而治之模式。在分而治之模式中,问题被分成许多并行的子问题。每个子问题被单独解决。当每个子问题被解决时,结果合计到最后的结果中。因为每个子问题都能被单独解决,这些子问题有可能被并行执行。
分而治之的方法被广泛应用于诸如合并分类的算法。这些算法非常容易被并行化。这种模式很好地处理了负载均衡,这点对缓存的有效利用非常重要。
3) 几何分解模式。几何分解模式基于正在解决问题的数据结构的并行化。在几何分解中,每个线程负责操作数据块。这种模式可能适用于诸如热流和声波传播之类的问题。
4) 流水线模式。流水线模式的意思类似于一条工厂的产品装配线。这种寻找并发的方式使计算被分割成一系列阶段,每个线程在不同的阶段同时工作。
5) 波阵面模式。波阵面模式在处理二维网格中延对角线的数据元素时非常有用。如下图所示。
波阵面数据模式
上图中的数字解释了数据元素被处理的顺序。譬如对角线的元素包括数字3是独立于之前被处理的数字元素1和2的。
上图中阴影中的数据元素表示数据已经被处理。在这种模式下,减小每个线程的空闲时间非常关键。负载均衡在此种模式中非常关键。
更加详细的并行编程设计模式的介绍请参考"并行编程模式"(Mattson 2004) 一书。
*本文观点引自英特尔公司系统架构师Shameem Akhter和高级软件工程师Jason Roberts的文章
如需了解英特尔软件产品相关的性能和优化选项,请参阅优化注意事项.
评论 (32) 
| 2009年04月05日 20:02
antoino | 还好了,有懂也有点糊涂!呵呵 |
| 2009年04月08日 04:01
test_parallel | 翻译有些名词不得体, 不过还是能学到不少 |
| 2009年04月11日 07:06
queeten
| 分而治之给他翻译成分离和战胜, 天。 |
| 2009年04月12日 19:08
Hai Shen 沈海 (Intel)
| 非常感谢test_parallel和queeten的指正,已经更改了相关名词翻译,希望有助大家理解内容! |
| 2009年04月18日 22:19
Raymond | 能给一下英文原文链接吗? |
| 2009年04月18日 23:29
yefengnidie
|
里面的题 好难做啊 看完了 也找不到。。 啊啊啊啊 |
| 2009年04月20日 06:48
lichengyong998
| just the thoery! |
| 2009年04月23日 21:50
zhangzhe65
| 很好,值得看 |
| 2009年04月24日 06:41
clark927
| 收藏 |
| 2009年04月25日 03:44
rong | 复杂 |
| 2009年04月28日 20:34
mayee2009
| 大哥,这几种模式能附上英文原文么? |
| 2009年05月11日 06:47
huotui88
| 有点难度 |
| 2009年05月12日 07:13
??? | 呵呵,学起来有些吃力! |
| 2009年05月13日 05:30
finallaugh927
| Cool |
| 2009年05月13日 09:20
无尘 |
不错哈 |
| 2009年05月13日 09:26
Vincent
|
“程序设计者必须重新思考程序的过程流”,很同意这句话。并且还要注意避免数据竞争。 其实,任务分解、数据分解和数据流分解都有很多应用领域,文中的“评论”未免太局限了! |
| 2009年05月16日 20:23
ealiana | 如果有英文原版的就更好了! |
| 2009年05月19日 23:26
天涯 | 感觉有点晕,估记经验不够,搞不懂架构师都是怎么浑出来的,我想学架构,但是感觉很难. |
| 2009年05月20日 19:51
温先辉 |
学习 |
| 2009年05月23日 07:34
y5254yyahoo.com.cn
| 好用吗,是不是全英文的 |
| 2009年05月23日 07:34
y5254yyahoo.com.cn
| 好用吗,是不是全英文的 |
| 2009年05月25日 08:31
倪礼 | 看不懂耶 |
| 2009年05月25日 09:16
倪艳华 | 啥子 |
| 2009年05月29日 18:14
阿磊 | 学习学习 |
| 2009年05月30日 20:22
段志飞 | good |
| 2009年07月26日 20:00
勇翔 | 举个轻松一点的例子,比如玩网游做任务,有些任务是关联的,有些是无关的,有些任务道具也是关联的,而任务所在地又分布极广, 这时如果在做之前能很好地利用并行思想详细规划一下,绝对能够事半功倍,大大缩短任务时间,提高效率. |
| 2009年09月17日 01:12
xiaolu | good!! |
| 2009年11月08日 06:07
WaiTing | 不错. |
| 2009年12月24日 18:43
王鹏亮 | 嗯 ,不错,很到位 |
| 2010年02月04日 23:40
NEO | 有时候确实需要单独起线程操作,更多的时候可 就用不到,遇到过一个是,用户操作其他数据的 |
| 2010年05月22日 16:28
HALIXIANGPING |
我编的程序:《简普财务软件》简介 本程序为适应目前计算机不断普及到企业和家庭的发展,根据广大中小企业财务人员没有财务计算机专业技术的需求,应用MICROSOFT VISUAL FOXPRO FOR WINDOWS (数据库)语言,根据最新企业会计制度和增值税一 纳税人的特点编制,采取人机对话方式,具有多 应用菜单,灵活多样,即使用了现代图文并用、 系 统 运 行 环 境 1.硬件配置环境:386以上中央处理器,至少4MB以 的内存,40MB以上剩余硬盘空间,一个WINDOWS所支 . 2.层 次 数 据 模 型及软件的安装 A、B、引导系统模块B、窗口显示模块 下属模块:退出、使用说明、录入模块、查寻模块、删除复制模块、修改数据模块、打印模块、自由浏览模块 3、软件的安装:将本程序提供的系统软件复制到 算机的“D:”盘JPCWXT,即“D:JPCWCX”,然后找到 件名为,“pvfp9set.exe”的文件,点击后,根据系统 便直接进入程序界面,根据需要进行工作了。在 级应用菜单中,按需选择光带显示部分或选序号, 4、用本程序提供的如发生录入错误,或输入指令有误,程序以外停止,请点击右上角对话框的“ X ”按钮,关闭对话框退出后重新进入程序,切不可对程序语言做任何删减变动。 5、数据库初始时,要事先确定好所建数据库文件 的名称,(如:哈食品公司10年数据库文件,可命 名为:H10SJK),但文件名最长不能超过8个字符。利 本程序提供的功能,从数据库模板复制数据库的 构即可完成数据库的初始化工作。(数据库模板 名称为:SJKMB)。然后利用本程序的相关模块进行 6、一般年度只需设立一个年度总帐文件。上例的 度总帐文件可命名为H10ZZ。利用本程序录入、累 账目模块提供的从库文件中提取某月数据并入总 账并完成累计账目。年数据库文件的第一笔记录 如有上年结转内容,应在摘要栏中输入上年结转 7、在年初时,应将上年各科目余额单独输入到本年 的数据库文件中,并在摘要拦内注明上年结转字 ;带有数量账户、往来帐目,固定资产、待摊费用 等。也可以在名称后加规格,如长粒香5、长粒香1 0等。一张凭证涉及二个以上名称、数量的,须逐 一张凭证中,一个会计科目必须对应一个金额,如:借-现金 200,贷-银行存款100,贷-应收账款100 而不能录为:借-现金 100 贷-银行存款100,借-现金 100,贷-应收账款100。 8 、根据对帐目资料需要的要求,可及时使用打印系统,打印出帐目,打印用纸为A4纸,原则上, 每季度必须打印出一套.注意输入正确的帐户编号和衔接序号. 9、输入汉字时,请同时按 ALT+F2 键,并注意 CAPS_LOCK键字母与汉字的转换.输入时,个别科目未标 明借贷方向,紧挨科目名称的为借、依次为贷。有 利用查看模块查 看本期凭证帐目时,显示数据为当年数,不含上 数。查看总帐目汇总时,含历史数据,起始月应 例图1:进入程序界面1、2图 例图2:数据录入模块界面、例图3: 例图4:修改、查看数据库模块界面例图5:查看数据、报表模块界面 例图6:查看科目试算平衡模块界面 例图7:删除、复制模块界面、例图8:凭证式录入模块界面 例图9:数据库累计界面、例图10:查看资产负债表界面 例图9:显示总账账户汇总表界面、例图10:某一级账户明细表界面 由于本人水平有限,经验不足,不当之处请谅解,并请您提出宝贵的意见。联系电话:15945121079 emall:HALIXIANGPING 163.COM。 |
引用 (1)
- 并行编程中的任务分解模式
2011年05月22日 06:12
写评论 
Hai Shen 沈海 (Intel)
|


毛毛(C++编程)