多核集群上的混合并行分子动力学计算研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户：hgs061268109

【摘要】

：

随着高性能计算机的快速发展和计算资源的日益丰富，高性能计算已成为当今国内外研究的热点。由于高性能计算机的主流结构已从大规模并行处理机转向多核集群，系统也从单一内存模

【作者】

：

白明泽

【出处】

：

电子科技大学

【发表日期】

：

2012年01期

【关键词】

：

混合编程模型多核集群分子动力学 MPI OpenMP

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着高性能计算机的快速发展和计算资源的日益丰富，高性能计算已成为当今国内外研究的热点。由于高性能计算机的主流结构已从大规模并行处理机转向多核集群，系统也从单一内存模型转向混合内存模型，为高性能计算机所设计的并行程序必须适应这一转变，从而产生了混合并行编程模型。分子动力学（Molecular Dynamics，MD）模拟作为一种重要的科学研究方法，在多个学科领域里得到了广泛地应用。进一步加快MD模拟在多核集群上的计算速度，促进这些领域的科研工作进一步发展就变得非常紧迫。然而，当人们在设计多核集群上的基于混合并行编程模型的并行MD算法以及其它并行算法时，普遍遇到引入多线程并行时开销过高的问题，使混合模型常常不如原来的纯消息传递模型。因此，如何解决这类问题，提高科学与工程计算程序在多核集群上的计算速度，是当前研究的一个重要方向。本文全面系统地研究混合并行编程模型、混合并行MD算法的研究现状和存在的不足，在此基础上提出了一系列相关问题的优化或改进算法。本文的主要内容及创新点如下：(1)本文深入地分析了适用于多核集群的混合并行编程模型、并行MD算法的基本原理和基本实现方法，为后面提出的多核集群上的混合并行MD算法打下了基础。(2)本文论证了Critical Section算法进行多线程并行MD计算的可扩展性问题，理论分析和实验结果表明，Critical Section算法在处理器核心数量大于8时的加速比明显下降。本文进而提出了一个称为三角形并行MD算法的优化方法，该方法通过静态分配原子集的策略让各线程在不同的时刻进入临界区，从而减少临界区的闲置时间，加快并行计算速度。(3)本文提出了基于OpenMP的并行MD算法——SPMD-like（Single ProgramMultiple Data）算法。该算法采用与SPMD程序相同的各自处理数据并冗余计算跨区域数据关系的策略，但是在实现上却接近简单的OpenMP实现，不需要修改MD的内部计算逻辑，只需要修改几个数据结构并添加一个空间分解子程序。该算法在保持OpenMP实现简单特点的同时取得接近纯消息模型的并行计算性能和可扩展性。(4)本文提出了一种多核集群上的基于混合MPI/OpenMP模型的并行MD算法。该算法在保持尽量小修改原则的基础上，将SPMD-like算法嵌入纯MPI并行MD程序中。该混合并行程序在节点内采用OpenMP并行，在引入较小并行开销的同时，明显地减少了节点间的通信时间，从而有效地提高了MD程序在多核集群上的计算速度和并行效率。(5)本文提出了一种完全避免临界区的归约算法——分块轮换归约算法，该算法在保持与Critical Section算法相似的简单性的同时，具有比Critical Section算法更好的并行性能和可扩展性。理论分析和实验测试证明该算法在节点内处理器核数为16时并行性能较好，但是达到32以及更大时，它的性能不如SPMD-like算法。因此它和SPMD-like算法分别适合于不同的混合并行场合：节点内处理器核数量不多时，可选择实现较简单的分块轮换归约法；处理器核数量较多时可采用性能更好的SPMD-like算法。(6)本文提出了一种基于混合MPI/TBB模型的并行MD算法，并以LAMMPS为例进行了它的实现研究。实验测试结果表明，当多核集群中参与计算的节点数增加到一定程度后，混合模型可以获得比纯MPI模型更好的并行性能，且主要原因是通信时间的减少。

其他文献

柴达木肉苁蓉人工接种技术

根据项目区条件,使用肉苁蓉人工栽培先进技术成果,结合本地区治理沙漠的实践经验,大面积营造梭梭人工林,防风固沙,改善生态环境;进行肉苁蓉人工栽培,获取产业利润,实现沙漠治

期刊

肉苁蓉项目推广成果人工栽培技术

谢有顺专栏:小说的可能性之一——小说:回到当代

【正】在当代的小说中,我们却读不到当代人真实的生活图景与精神境遇,无疑是一件令人困惑的事。从1987年以后,许多有才华的作家都普遍转向历史与语言这两个迷宫,从而构筑个

期刊

叶兆言当代性孙甘露价值立场卡夫卡生存境遇当代作家当代生活

公安部部署开展全警实战大练兵

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

大练兵公安部职业化建设

好氧反硝化菌强化序批式活性污泥反应器处理生活污水

研究了好氧反硝化菌强化序批式活性污泥反应器(SBR1)处理生活污水的性能,同时以只接种相同量普通活性污泥的序批式活性污泥反应器(SBR2)作为对照组。结果表明:(1)反应前21天

期刊

好氧反硝化菌生物强化生活污水

青少年正畸治疗前、后心理状态的对比研究

目的探讨错畸形和正畸治疗对青少年心理健康的影响。方法应用症状自评量表（SCL-90）对116例13～18岁青少年正畸前、后心理状况进行测量和比较。结果正畸前有39.65%的青少年存在心

期刊

错畸形正畸症状自评量表malocclusion； orthodontics； symptom checklist 90

基于DEA方法的农村信用社运行效率实证研究

农村信用社（简称农信社）是农村金融工作的主力军，它对推动新农村建设起着积极的作用。但近年来，农村金融市场竞争激烈，运行效率的高低已成为关乎农信社生死存亡的大问题。本文根据

期刊

农信社相对效率C2RDEA

数据中心中自适应绿色控制技术研究及其应用

数据中心,作为支撑大数据处理和云计算平台的核心,通过网络向企业和公众提供多种服务,从高性能计算、海量数据存储到各类互联网服务。随着互联网和信息社会的进一步繁荣,特别

学位

数据中心自适应控制绿色计算虚拟化资源管理

儿童支气管哮喘血清粘附因子-1和嗜酸细胞阳离子蛋白的变化及临床意义

目的：探讨血清可溶性粘附分子-1（sICAM-1）和嗜酸性粒细胞阳离子蛋白（ECP）在小儿支气管哮喘患儿中的变化及其临床意义。方法：分别采用酶联双抗夹心法及荧光酶联免疫方法检测50例支气

期刊

可溶性粘附分子-1嗜酸性细胞阳离子蛋白小儿支气管哮喘

拔除第二前磨牙与非拔牙正畸矫治后牙根吸收的研究

目的探讨正畸治疗中拔除第二前磨牙矫治与非拔牙矫治对牙根吸收（RR）的影响。方法在12～14岁年龄段中,选择50例正畸患者的596颗牙齿为研究样本,将研究对象分为拔牙组与非拔牙组,每

期刊

牙根吸收磨牙正畸学矫正root resorptionmolarorthodonticscorrective

多核集群上的混合并行分子动力学计算研究

其他学术论文