异构多核环境下共享缓存管理技术的研究

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:lzslzs2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半导体科技的进步以及对高效节能计算的迫切需求促进了一个芯片内不同结构计算内核的集成。目前的异构多核处理器大多集成通用处理器核和专用处理器核。其中通用处理器核作为主控处理器负责通用计算,同时运行操作系统、任务分配和调度;专用处理器核作为加速设备负责密集型的计算,用于加速特定领域应用。异构多核系统的可用性表明异构多核系统正在成为主流。图形处理单元(GPU)是使用最广泛的用于集成的数据并行加速器,集成中央处理器(CPU)核心和GPU核心的异构多核处理器充分利用了这两种不同的处理器的优势。这种架构中,CPU和GPU之间共享各种资源,诸如最后一级高速缓存、片上互连、存储器控制器和片外DRAM存储器。共享高速缓存能够实现CPU和GPU之间的快速数据共享,提高CPU和GPU应用程序的性能。然而,CPU和GPU核心集成到同一个芯片上也导致两者对共享缓存空间的争用,在异构多核架构下研究缓存管理需要重点关注。本课题首先分析异构多核架构下CPU和GPU应用程序的访存行为特征。GPU核心相比CPU核心能够提供更高水平并行特性的特点使得GPU应用程序可以达到比CPU应用程序更高的数据访问速率,致使大多数可用的共享高速缓存空间被GPU应用程序使用,仅为CPU应用程序留下非常有限的高速缓存容量。另外,当GPU应用程序中的线程必须等待来自主存的数据时,通常还有许多其他线程可以在此期间执行,高速缓存未命中对GPU应用程序的性能具有有限的影响,因此,CPU应用程序通常比GPU应用程序对可用高速缓存的大小更敏感。综合这两个方面可以得出,在异构多核处理器中,尽管CPU应用程序比GPU应用程序需要更大的缓存空间,却往往获得相对较小的共享高速缓存容量,并且GPU应用程序具有一定的高速缓存访问延迟容忍能力。当前的缓存管理方法包括缓存分区和缓存替换算法,很少有考虑CPU应用程序和GPU应用程序访存特性的,研究一种适合异构架构的缓存管理方法十分必要。针对以上情况,本课题提出一种基于Bypass的共享缓存管理方法,该共享缓存管理方法通过限制GPU应用程序对最后一级共享缓存的访问,转而访问内存来实现CPU和GPU应用程序对共享缓存访问的分离,缓解CPU应用程序和GPU应用程序对共享缓存的争用,提升CPU应用程序的性能,从而提升整体系统性能。考虑到运行过程中CPU和GPU应用程序的不同访存特征,对上述管理方法进行进一步优化,提出基于Bypass的动态共享缓存管理方法。该方法在程序运行过程中动态分析CPU应用程序和GPU应用程序的不同缓存敏感特性,在处理GPU访存请求的时候考虑CPU和GPU应用程序的当前访存特性,实时判断GPU应用程序是访问内存还是访问共享缓存,进行动态调整,使其更好地适应不同的应用程序。为了精准地评估实验方案对系统性能的影响,本课题采用gem5-gpu异构多核模拟器作为基础架构模拟平台,并用SPEC CPU2006测试程序集和Rodinia测试程序集进行实验验证。实验结果表明,本课题设计实现的基于Bypass的共享缓存管理方法与传统的缓存管理方法相比,可以提升CPU应用程序的性能。以GPU应用程序backprop为例,CPU应用程序性能最高提升21%,平均提升13%。基于Bypass的动态共享缓存管理方法在最小程度影响GPU应用程序性能的情况下提升了CPU应用程序的性能,从而提升了系统整体性能。以GPU应用程序backprop为例,CPU应用程序性能最高提升15%,平均提升7%,GPU应用程序的性能基本不受影响。
其他文献
作者在该文中通过对实际业务提供方式与智能网概念模型进行映射研究,并在总结智能业务领域的开发经验基础上,对多业务嵌套问题在理论层面提出了一套与产品无关的解决方案,并
随着网络技术和软件技术的不断发展,高校中的各部门都开发了自己的管理软件,它们的开发过程、开发平台以及开发技术各不相同,使得彼此间的通讯和资源共享难以实现,形成一个个的信
网格是构筑在互联网上的一组新兴技术,由于能支持大规模的科学协同工作和工程计算方面的问题,故而在计算机技术领域拥有越来越重要的位置和广阔的发展前景。本文是中科院计算所
随着互联网技术的日益发展,互联网能够提供越来越多的服务,这些不同类型的服务要求的不同的服务质量等级.下一代的互联网应该从单一的尽力而为提供服务方式转变为提供不同服
市政信息管理系统是城市信息管理系统的一个重要组成部分,也是地理信息系统在市政建设方面的一个重要应用.在当前政府部门信息化的过程中,市政部门的信息管理系统对于整个政
随着云计算和大数据技术的高速发展和广泛应用,大规模问题的计算方式发生了根本性变化。计算能力有限的用户端通常会将大量的本地私有数据或运算外包到云服务器端进行存储或代
随着计算机网络的发展,网络攻击也在迅速发展,网络安全越来越受到人们的重视和关注.能够检测和处理网络攻击的入侵检测系统(IDS)作为一种重要的安全部件,也得到了长足的进步.
组合优化中的NP-hard问题和非线性全局优化问题是优化研究中的难点。近年来,有许多人采用模拟退火(Simulated Annealing)、遗传算法(Genetic Algorithms)和人工神经网络(Artificial
本文介绍了专家系统的基本概念与原理;讨论了产生式、语义网络、框架、谓词逻辑等多种知识表示方法;描述了正向链、反向链、不确定性推理等多种推理技术。在专家系统基本理论的
近几年来,中国移动通信的发展十分迅速,数字技术的应用给移动通信开发大容量,高性能,多功能的应用提供了坚实的后盾.除了移动运营商自身提供的各种移动业务以外,更有许多服务