软硬件协同支持的多核事务存储体系结构

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:abcd_11840
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多核平台的普及,如何利用多核加速串行应用的执行已成为学术界和工业界共同关注的热点研究问题。而传统的显式锁同步机制自身就有着高复杂性、易错性和性能保守等天然缺陷,从根本上限制了并行程序的可扩展性和编程效率,也限制了对多核资源的充分利用。为了开发更多的多核结构上可利用的线程级并行性,利用事务存储(Transactional Memory,TM)技术来解决并行程序正确性维护给并行编程带来的复杂性和对性能的制约问题,已成为学术界和工业界的共识。本文从有效开发应用中的线程级并行性入手,着眼于高效能、易编程和可兼容这三个目标,通过软硬件协同的方式对多核事务存储体系结构展开深入研究,使之既能提高多核芯片片上计算资源的有效利用率,又能有效降低并行编程难度,平滑移植传统应用软件。   本文从软硬件协同多核事务存储体系结构的线程划分和线程执行两个方面开展了深入系统的研究,涉及结构模型、编程模型、性能分析模型、离线剖析指导线程划分机制和在线剖析指导线程执行机制等方面的内容。主要研究内容和成果包括:(1)对两种主流线程级推测并行技术的发展趋势进行了详细而深入的调研,通过对其软硬件支持机制的分析与比较,提出了一种新型的软硬件协同支持的多核事务存储体系结构设计方案。该系统在线程划分中采用软件线程级推测技术思想,而在线程执行时采用硬件事务存储技术支持,并通过离线剖析和在线剖析技术来协同各种软硬件因素,达到了同时提高程序性能和降低并行编程难度的双重目标。(2)在软件线程划分方面,从简化并行编程和提高并行执行性能的角度出发,提出了一套线程级推测并行性的判定准则、研究方法和剖析机制,确定了利用离线剖析技术来实现基于事务存储的线程划分方案。并依据该机制设计并实现了一套线程级推测并行性离线剖析工具集OpenPro。(3)利用OpenPro工具集,对桌面应用、多媒体应用和高性能计算应用中影响线程级推测并行性的关键因素进行剖析,从应用本身并行潜能的角度探讨了“当前多核技术路线还能走多远”和“如何认识线程级推测并行技术的技术适应面”这两个问题,获得了诸如单个程序仅能有效利用16核的计算资源是当前多核技术路线的拐点等一些重要认识。(4)在线程执行支持机制方面,从可扩展性好和易于硬件实现这两个目标出发,提出了一种支持优先级判定的基于目录的高速缓存一致性协议,并在此基础上设计和完成了一种利用运行时库机制同时支持线程级推测和事务存储语义的分布式可扩展多核事务存储处理器PTT硬件模拟器。该处理器设计突破了以往类似方案中总线等集中式结构对硬件系统可扩展性的限制,同时实现了可扩展性好和易于硬件设计实现的目标;而这套采用积极版本管理和积极检测机制的分布式硬件事务存储机制会自动维护硬件系统的一致性,极大地减少了程序员在进行并行程序设计时的繁杂工作和复杂程度。这对于普及并行程序设计,提高并行程序生产力都有着非常重要的意义。(5)提出了一种针对线程级推测并行技术的PCL性能分析模型,并依据该模型提出了将在线剖析技术引入PTT硬件模拟平台的最终技术方案。同时通过对PTT系统多种软硬件手段实现机制的分析与协同,分别从正确性、有效性和灵活可配置性三个层次对其进行了充分的评测和分析。   本文的研究工作获得了如下一些重要的认识:(1)将线程级推测技术与事务存储技术结合起来,通过软硬件因素的合理协调,可以有效地开发出串行程序中潜在的线程级并行性,同时有效地降低并行编程的难度,极大地提高并行程序设计生产力。(2)在目前以传统超标量单核构造多核芯片的技术路线下,着眼于同时兼顾硬件的有效利用率和尽可能挖掘程序中固有的并行性,在加速单个串行应用时,部分依赖严重的应用(如SPEC和一些依赖严重的科学计算程序等)采用2-4核就已经足够;而多数多媒体应用和高性能计算应用采用8-16核来加速比较合适;一些特别适合的应用则可以有效利用64-128核及以上的计算资源。(3)虽然现在线程级推测并行技术在桌面应用这样一些程序中数据依赖严重的应用中效果不佳,但在部分拥有大计算量、推测线程粒度适中并且存在模糊依赖的多媒体和高性能计算应用中还是适宜采用的。线程级推测并行技术最大的优势是其兼容性与易编程性,只要在这两点上做好文章,实现多数经典应用软件到多核平台上的平滑移植,进一步解放程序员,线程级推测并行技术就会在体系结构研究中拥有重要的一席之地。   本文的研究工作和结果可用于指导共享存储的多核芯片体系结构及其并行编程环境的设计,以尽可能小的并行程序设计难度、系统软件复杂性和系统硬件代价,尽可能多地从串行程序中开发出多核芯片上可利用的线程级并行性。
其他文献
随着信息时代科技进步和数据量的剧增,数据、信息作为一种新时代的资源,影响商业利益,推动经济发展,成为被企业和个人关注和争夺的焦点。争夺的背后是大量数据的存储、计算和处理
全球Internet的蓬勃发展,特别是移动互联网的兴起,促进了P2P技术的兴盛,以P2P技术为基础的各种文件共享、即时通信、流媒体、分布式计算程序都获得了广泛的应用,VoIP作为一种
随着网络资源数量的不断增长,信息更新的不断加快,信息冗余、主题参杂等问题相继出现,人们想高效地搜索到自己想要的信息变得越发困难。在解决这些问题的过程中,提供个性化服
不论是在传统网络中,还是在无线传感器网络中,路由算法都是支撑网络传输的关键技术。本文首先介绍无线传感器网络路由协议的特点以及分类,分析了当前的经典无线路由协议。重
随着信息时代的到来,数据呈爆炸式增长,如何从海量数据中找到用户的兴趣点,并将用户感兴趣的物品推荐给用户,成为当今各领域研究的热点。同样在各高校图书馆中,如何解决信息资源过
随着计算机网络的广泛应用,人们对网络的依赖程度越来越高,与此同时网络安全问题也变得越来越重要。尤其近年来,新兴的移动Ad Hoc网络快速发展,由于其采用了更为开放的网络体
随着社会对多品种、小批量产品需求的增加,复杂产品综合调度的瓶颈问题逐渐成为调度优化研究的一个热点。本文在对国内外的研究现状分析的基础上,针对现有的通过计算每台设备上并行工序总加工时间确定复杂产品综合调度可增加瓶颈设备的方法,与该设备实质并行时间有较大的出入的问题,提出了基于静态并行时间确定可增加瓶颈设备的算法。由于设备高额的成本和折旧费用,企业不可能盲目地增加某台设备,本文通过计算静态并行时间确定
本文主要对医学图像序列可视化的两个基本的问题进行了深入研究,即医学图像序列的感兴趣区域(Region of Interest,ROI)分割与三维可视化(3D Visualization)的理论与方法研究
随着中国城市化的快速发展,中国传统特色建筑物面临着被现代建筑所替代,逐渐消失的危险。近年来,为了保护特色建筑、弘扬传统建筑文化,大场景特色建筑(群)的快速、自动建模技
无线传感器网络是由众多小型、无线、低能耗的传感节点构成的集数据感知、信息处理和通信传输于一体的大型分布式系统。由于在大时空尺度下高效的分布式感知与处理能力,无线