异构并行系统计算资源协同调度机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:btlovers
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构并行系统通常是指由中央处理器(Central Processing Unit,CPU)与图形处理器(Graphics Processing Unit,GPU)、现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)等协处理器共同组成的计算方式异构的高性能计算系统,因能提供更为高效的应用加速能力而被广泛部署,在大数据、人工智能等众多关键领域得到了广泛应用。当前,异构并行系统是计算机系统领域的研究热点。其中,如何高效实现异构并行系统计算资源的协同调度已成为关键难题,极大影响着异构并行系统的负载均衡能力、任务并发能力和整体性能。
  异构并行系统计算资源的协同调度难题主要包含三个方面的问题:1)如何提升CPU与协处理器之间的负载均衡能力,最大化异构并行系统的计算资源利用率。现有以任务迁移为基础的CPU-GPU任务调度机制存在调度粒度粗、迁移代价大等问题,难以高效应对因负载波动引起的负载不均衡问题;2)如何提升CPU与协处理器所共同执行任务的并发性能。现有GPU虚拟化技术存在资源占用过高、并发能力低等问题,拖累CPU-GPU异构并行系统的整体并发能力较低;3)如何实现计算任务在CPU与协处理器之间合理调度与分配,大幅减少因任务协作导致的交互开销。受限于当前FPGA平台与CPU之间进行交互时的高延时与低带宽特性,不合理的任务动/静态分配不仅加剧了异构并行系统的协作开销,也极大降低了整体系统计算性能。
  鉴于GPU和基于FPGA的特定领域加速器在各类应用中得到了广泛应用,因此以两类常用的并行系统为研究对象:CPU-GPU异构并行系统和CPU-FPGA加速器异构并行系统,深入开展研究。为实现更高效的异构计算资源的协同调度,分别提出了面向负载均衡的CPU-GPU任务协同调度技术、面向高并发的CPU-GPU任务协同调度技术以及基于任务特征的CPU与FPGA加速器的协同调度技术。
  面向负载均衡的CPU-GPU任务协同调度技术主要为异构计算系统提供面向资源高效利用的负载均衡保障。通过冗余计算技术、GPU间动态任务调度技术以及动态任务迁移技术,建立起更细粒度的、少数节点的、开销可控的动态协作机制,设计了契合而高效的动态负载均衡模型,并设计了快速算法实现动态的负载均衡调度。实验表明,该机制不仅较好地解决了负载不均衡问题,也降低了调度中的任务迁移代价低。
  面向高并发的CPU-GPU任务协同调度技术主要针对提升延时敏感、多资源需求的在线任务的并发性能。利用CPU和GPU负载的解耦合和轻量级的负载迁移机制,规避了虚拟化平台对GPU硬件特征支持不足的问题,解决了资源瓶颈的问题。同时将任务进行细粒度划分,设计高并发调度机制。以典型应用云游戏为应用案例,实验结果表明,该机制在保证基本的服务质量前提下,实现了最高4倍的并发性能提升,并减少了资源浪费。
  基于任务特征的CPU与FPGA加速器的协同调度技术致力于降低CPU与FPGA加速器的协作开销,提升软硬件的协作效率。该技术以当下最流行的加速卷积神经网络计算为例,根据任务特征静态地为CPU与加速器划分协作任务,设计了支持细粒度协作的、基于Winograd快速算法的加速器,并在运行时基于理论性能预测,动态地进行数据划分,实现CPU与加速器的协同调度。实验表明,该设计相较于CPU实现了4倍的性能提升,相较于基于快速傅里叶变换的加速器,以45%的硬件资源消耗,实现了1.13倍的性能提升。最后从理论上证明该设计仍有5倍的潜在性能提升。
  本文提出的方法能有效提升异构计算系统的负载均衡能力、系统并发度以及实现更高效的软硬协同,提升整体性能,具有较高实用价值和应用前景。
其他文献
脉动热管(PHP)是20世纪90年代发明的非传统热管,它是一种被动但高效的热管理装置,在太阳能电池、燃料电池、空间和电子冷却及混合动力汽车中具有良好的应用前景。PHP分为蒸发段、绝热段和冷凝段三部分,其没有吸液芯辅助工作流体从一个区域流向另一个区域,但毛细作用在这方面起到辅助作用。许多研究表明,流体热动力学和相变行为主要取决于工作流体的类型、填充率(FR)、热输入、抽空压力等。然而,对于PHP的工
学位
在弹用超声速“X”型进气系统的研究中,倒置进气道由于大攻角下性能更占优,因而受到广泛关注。本文针对Ma2~4速域范围进行了倒置二元进气道方案设计,给出了全包线范围内总体性能,并与正置方案进行了总体性能的比较。  文中首先针对倒置进气道,开展了外压段波系配置、内压段泄压槽、亚声速扩压段以及设计点对进气道性能的影响研究,获得了一种性能较优方案。进气道采用部分等熵压缩方法设计,内压段布有两道泄压槽。计算
城市废水厂中的污泥含有很多有毒有害物质,如果不加以妥善处理,将造成严重的二次污染。热解作为常规的污泥资源化利用处理手段,其主要副产物为污泥热解炭,廉价而易得,具有广阔的应用前景。另一方面,燃煤工业和机动车向大气排放大量的NOx,不仅对环境造成破坏,并威胁人类的健康。然而,通过热解制备的热解炭中含有丰富的碳元素和优良的孔隙结构,既可作为还原剂也可作为催化剂载体,应用于脱硝反应中。因此,本文将以污泥热
学位
正丁醇是具有发展潜力的内燃机生物替代燃料。均质充量压缩着火(HCCI)方式是提升传统汽油机热效率的有效方案。将正丁醇应用于HCCI发动机是缓解能源供需紧张的重要措施。本文利用负气门重叠角策略,在单缸四冲程发动机上研究了平均指示有效压力(IMEP)≤0.3MPa,当量空燃比条件下正丁醇/乙醇-汽油HCCI发动机燃烧特性和排放规律,并研究了不同推迟着火时刻方式对正丁醇HCCI发动机燃烧特性的影响。此外
CO2捕集技术作为一种负碳排放技术,可以有效实现电厂等大型碳排放源的碳减排,进而应对全球变暖和气候变化。化学吸收法是发展最为成熟,且最接近商业化的碳捕集技术,但是较高的捕集能耗限制了其进一步发展与应用。本文从多个方面分析了提升化学吸收法碳捕集技术能效的方法,形成了“循环分析及优化—技术实现、验证及优化—系统集成及优化”的分析路径,从单个循环到实际系统再到多系统集成,逐步提升化学吸收法碳捕集技术能效
学位
微波光子技术结合了微波技术和光子技术的各自优势,有望解决传统雷达难以实现的宽带信号产生和处理问题。然而现有的微波光子系统大部分基于分立器件构建,存在着重量大、体积大、成本高、可靠性差、易受环境影响等问题,严重制约了微波光子技术在雷达系统的实际应用。微波光子系统集成化是解决上述问题的重要途径,也是现阶段微波光子技术的研究焦点。  本文以集成微波光子雷达为研究方向,围绕其中的滤波、延时、移相及系统验证
保障智能卡、射频识别、无线传感器网络等资源受限设备的信息安全,已成为密码学领域备受关注的科学问题。为能更好实现密码性能在安全与高效之间的有效兼顾,本文对基于动态轮数的混沌分组密码开展研究。主要研究内容说明如下:  针对有限运算精度造成混沌系统动力学特性退化,通过统计测试分析得出量化方法和参数设置对数字混沌特性的影响规律,采用级联和扰动的补偿方式构建动力学特性显著增强的数字混沌模型,从而更好满足混沌
学位
量子信息与量子计算领域中两个著名的研究成果——BB84密钥分配协议(Bennett-Brassard protocol proposed in 1984)和Shor的质因子分解算法——均对现有的密码体系产生了深远的影响。然而,更具广泛应用前景的Grover迭代算法在穷举搜索之外的密码学应用还未经充分研究。此外,另一类典型的量子迭代运算过程——量子随机行走——的非马尔科夫模式(或具有记忆的量子行走算
数据建模是机器学习和人工智能领域的重要研究问题,聚类分析可以有效地挖掘数据内在的模式和规律。复杂网络(图数据)作为新的研究热点,对理解社会复杂系统有着重要的作用,可以有效地用于推荐系统、恐怖组织挖掘等问题。近年来,网络结构的动态演变给社团检测建模提出了新的挑战,如何采用高效的学习模型挖掘动态复杂网络内在的规律,实现社团检测和演化分析,成为动态复杂网络研究的重点。从动态复杂网络中节点重要性、社团结构
语义分割旨在为图像中的每个像素分配一个预定义的语义类标签,使计算机能够通过视觉的方式对场景进行细粒度地理解。该技术被广泛应用于自动驾驶、城市规划、智能家居等任务中,是计算机视觉领域的重要分支。近年来,基于深度卷积神经网络的分割技术将任务性能提升到了一个新的水平。然而,现有的深度学习方法需要大量的像素级人工标注图像作为训练数据,使得这些方法所需的时间和金钱成本十分昂贵。为了减轻手工标注数据带来的沉重
学位