面向多核系统的科学计算核心算法并行化研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wumingxiaoziwoaini
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
加速未来大规模科学计算的一种趋势是使用异构多核/众核系统。然而,相对于硬件系统的飞速发展,软件并行编程模型,特别是针对异构多核平台的并行模型发展相对滞后。如何在异构多核环境下充分利用硬件提供的并行计算能力,提高并行计算执行效率,成为当前并行编程工作的首要任务。为解决这一问题,本文提出了一种适用于异构多核系统的并行计算模型MS-BSP,与传统的通用BSP并行计算模型相比,可以更好地反映不同类型的任务分配到不同类型的处理器核并行处理的特征,指导在此类异构多核系统上的并行科学计算算法的设计和分析。在此种模型下,本文提出科学计算并行化编程框架。与IBM的Cell和Nvidia的CUDA架构下复杂的编程方式相比,MS-BSP模型下的编程方式将多线程的核函数映射工作交由系统自行完成,减少了开发人员对存储单元和同步机制的繁琐的显式操作,方便了编程。最后,本文在RED平台上按照MPI规范实现了并行编程与操作系统的接口,完成了对MPI函数的兼容,提高了所提出并行编程模型的可移植性。在此套并行化框架指引下,将科学计算应用领域中的六种核心算法进行并行化设计和优化,并在“浙大数芯”实验室设计开发的RED片上多核平台和IBM的成熟商业处理器Cell平台上进行实现和对比评估,验证了我们提出的并行计算模型的实用性以及高效性,最终六个算法在两个平台上都达到了较高性能。由于MS-BSP模型在RED平台上针对其主从式异构多核架构进行优化,使得任务调度开销显著减小,其实现效率(效率定义为并行加速比与实际加速核数目的比值)不低于75.67%,而在已有的Cell平台上,其实现效率不低于63.91%。
其他文献
随着Internet、物联网等的迅猛发展,物联网技术在LED显示屏方面应用取得很大进展,同时也对它的发展提出安全、可靠性新的要求和挑战。LED-DTIP (LED-Display Trust Integrate
LTE是3GPP在“移动通信宽带化”趋势下,为了对抗WiMAX等移动宽带无线接入技术的市场挑战,在十几年超3G(B3G)研究的技术储备基础上研发出的“准4G”技术。小区搜索过程就是UE和
双目立体匹配在机器视觉领域是非常关键且很有挑战性的一个研究课题,该课题的主要困难在于其较低的匹配精度和较高的时间复杂度。为了改进立体匹配算法,本文首先针对立体匹配
在当今信息高速发展的社会,无线通信的地位越来越重要,然而频谱资源却是制约无线通信发展的瓶颈。通过多项研究调查表明,频谱资源匾乏的根本原因是目前固定频谱分配制度存在着严
数据挖掘技术是近年来随着数据库和人工智能逐渐发展起来的一门新兴科学。作为一种新的数据提取工具,它能够自动地、智能地把数据转换成有用的信息和知识,决策制定者可以根据这
智能交通已成为将来交通系统发展的方向,它结合了现代通信、信号、控制等多种技术。智能交通的应用将使人们的出行变得更加便捷,它将对现代交通的各个方面产生深远的影响。定
多输入多输出(MIMO)无线通信系统不仅能够巨大地提高信号传输速率并且能够较大地增加空间分集增益,但是无法对抗由多径引起的频率选择性衰落,而正交频分复用(OFDM)系统具有很强
随着现代无线通信技术的快速发展,人们对高速数据通信服务的需求日益增长,常规单天线收发通信系统的容量性能已经远远不能满足实际应用的需求,通信系统的可靠性也有待进一步提高
2017年6月中旬,采用机械科学研究总院数字化无模铸造技术开发的大型船电发动机在广西玉柴机器股份有限公司顺利完成铸型的加工制造,该铸型尺寸达4024 mm×1420 mm×1610 mm,
期刊
传统机器学习中的分类算法,特别是目前应用广泛的支持向量机(SVMs)算法,大都是在批学习模式下设计的,即假设学习前拥有全部训练样本且可以通过一次学习得到最终决策模型。但实际中