异构内存混合粒度页面管理机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:laowang2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机软硬件技术的飞速发展,传统的动态随机访问存储器(Dynamic Random Access Memory,DRAM)因其存储能耗大、存储密度小、可扩展性有限等缺点已经无法满足应用越来越大的内存需求。新兴非易失性存储器(Non-Volatile Memory,NVM)尽管可以避免此类问题,但因其访问时延高、写次数有限及写功耗大,也无法直接作为系统内存。因此,混合使用小容量DRAM和大容量NVM形成的异构内存系统成为了当今内存研究的主流课题。然而,高性能异构内存的设计仍旧面临一个两难困境:一方面系统需要利用大页机制以应对大内存带来的地址转换开销;另一方面系统需要利用页面迁移提升系统性能。不幸的是,现有系统无法同时支持高效的页面迁移机制与大页机制。这是因为粗粒度页面迁移开销较大,而细粒度的页面迁移会破坏地址的连续性,阻碍大页机制的使用。因此,为了实现高性能异构内存,设计实现兼顾大页管理与细粒度页面迁移的页面管理机制成为了异构内存设计的关键挑战。
  为了应对以上挑战,在异构内存中支持混合粒度的页面管理势在必行。然而,在异构内存中支持混合粒度页面管理,面临诸多挑战,主要包括:轻量级页面监测与迁移机制,以及面向混合粒度页面的体系结构设计。在轻量级页面监测与迁移机制方面,主要表现在监测和迁移开销与监测准确性难以权衡。而在面向混合粒度页面的体系结构设计方面,主要是现有机制对连续性页面映射支持不佳,具体表现在:现有页表管理机制无法有效维护和利用迁移页面的固有连续性;现有快表(Translation Lookaside Buffer, TLB)映射机制对连续性页面支持不佳。
  为了克服上述研究难题,适应内存架构的演变,在异构内存混合粒度页面监测与迁移、混合粒度页面邻近性感知的页表管理,以及混合粒度页面多粒度TLB管理三个方面开展研究。
  在面向混合粒度页面的页面监测及迁移方面,提出了一种新的混合内存管理机制Rainbow来支持大页机制和轻量级页面监测及迁移机制。Rainbow以大页粒度管理NVM,并使用DRAM缓存大页中被频繁访问(热)的小页面。相应地,Rainbow使用分离式TLB来支持不同的页面粒度。Rainbow进一步提出了一种NVM到DRAM的地址重映射机制来识别迁移的小页面,而不会拆分大页。此外,Rainbow通过异步监测不同粒度的页面,极大地减少了需要页面监测的页面数量及开销。实验结果表明,Rainbow可以在不显著降低监测准确性的前提下降低高达98.4%(平均86.3%)的监测开销。同时,与没有大页支持的最新的内存迁移策略相比,Rainbow显著降低应用地址转换开销,并将系统性能提高多达2.9倍(平均为45.3%)。
  在面向混合粒度页面的页表设计方面,提出了一种新的邻近性感知的页表管理机制SuperPT,以减少页表查询相关开销。SuperPT利用混合DRAM分配器和基于伙伴系统的新型垃圾回收机制极大地保留了迁移页面间的连续性;与此同时,SuperPT利用新型虚拟哈希页表支持混合粒度页面,通过保留地址邻近性并以此支持范围映射,从而极大地提高了连续页面的映射效率,从而以更加灵活和高效的方式进行虚拟地址到物理地址及物理地址到虚拟地址的地址转换。实验结果表明,SuperPT可以显著减少内存访问时间(平均减少19.3%),从而平均提高9.5%的系统性能。
  在面向混合粒度页面的TLB设计方面,提出了一种新的异构内存管理机制Tamp来支持混合内存系统中的多粒度页面管理。由于同一个大页里面的热的小页具有显著的中间连续性,因此Tamp提出了支持混合粒度的新型TLB管理机制,该机制利用迁移页面的地址邻近性特征,显著增加了TLB的映射范围,从而显著降低了地址转换开销。与此同时,Tamp提出富有侵略性的多粒度页面迁移机制,以提高TLB合并的可能性。这些方案显著提高了TLB的覆盖率及映射效率。实验结果表明,与其他没有混合粒度页面管理支持的异构内存系统相比,该方法可以有效地减少TLB的缺失率(平均减少62.4%),从而显著提高系统性能(平均提高16.2%)。
  综上所述,异构内存环境下提出了异构内存混合粒度轻量级页面监测与迁移机制,混合粒度页面页表优化机制,以及混合粒度页面TLB架构优化机制,从不同方面解决了现有研究存在的不足。
其他文献
正丁醇是具有发展潜力的内燃机生物替代燃料。均质充量压缩着火(HCCI)方式是提升传统汽油机热效率的有效方案。将正丁醇应用于HCCI发动机是缓解能源供需紧张的重要措施。本文利用负气门重叠角策略,在单缸四冲程发动机上研究了平均指示有效压力(IMEP)≤0.3MPa,当量空燃比条件下正丁醇/乙醇-汽油HCCI发动机燃烧特性和排放规律,并研究了不同推迟着火时刻方式对正丁醇HCCI发动机燃烧特性的影响。此外
CO2捕集技术作为一种负碳排放技术,可以有效实现电厂等大型碳排放源的碳减排,进而应对全球变暖和气候变化。化学吸收法是发展最为成熟,且最接近商业化的碳捕集技术,但是较高的捕集能耗限制了其进一步发展与应用。本文从多个方面分析了提升化学吸收法碳捕集技术能效的方法,形成了“循环分析及优化—技术实现、验证及优化—系统集成及优化”的分析路径,从单个循环到实际系统再到多系统集成,逐步提升化学吸收法碳捕集技术能效
学位
微波光子技术结合了微波技术和光子技术的各自优势,有望解决传统雷达难以实现的宽带信号产生和处理问题。然而现有的微波光子系统大部分基于分立器件构建,存在着重量大、体积大、成本高、可靠性差、易受环境影响等问题,严重制约了微波光子技术在雷达系统的实际应用。微波光子系统集成化是解决上述问题的重要途径,也是现阶段微波光子技术的研究焦点。  本文以集成微波光子雷达为研究方向,围绕其中的滤波、延时、移相及系统验证
保障智能卡、射频识别、无线传感器网络等资源受限设备的信息安全,已成为密码学领域备受关注的科学问题。为能更好实现密码性能在安全与高效之间的有效兼顾,本文对基于动态轮数的混沌分组密码开展研究。主要研究内容说明如下:  针对有限运算精度造成混沌系统动力学特性退化,通过统计测试分析得出量化方法和参数设置对数字混沌特性的影响规律,采用级联和扰动的补偿方式构建动力学特性显著增强的数字混沌模型,从而更好满足混沌
学位
量子信息与量子计算领域中两个著名的研究成果——BB84密钥分配协议(Bennett-Brassard protocol proposed in 1984)和Shor的质因子分解算法——均对现有的密码体系产生了深远的影响。然而,更具广泛应用前景的Grover迭代算法在穷举搜索之外的密码学应用还未经充分研究。此外,另一类典型的量子迭代运算过程——量子随机行走——的非马尔科夫模式(或具有记忆的量子行走算
数据建模是机器学习和人工智能领域的重要研究问题,聚类分析可以有效地挖掘数据内在的模式和规律。复杂网络(图数据)作为新的研究热点,对理解社会复杂系统有着重要的作用,可以有效地用于推荐系统、恐怖组织挖掘等问题。近年来,网络结构的动态演变给社团检测建模提出了新的挑战,如何采用高效的学习模型挖掘动态复杂网络内在的规律,实现社团检测和演化分析,成为动态复杂网络研究的重点。从动态复杂网络中节点重要性、社团结构
语义分割旨在为图像中的每个像素分配一个预定义的语义类标签,使计算机能够通过视觉的方式对场景进行细粒度地理解。该技术被广泛应用于自动驾驶、城市规划、智能家居等任务中,是计算机视觉领域的重要分支。近年来,基于深度卷积神经网络的分割技术将任务性能提升到了一个新的水平。然而,现有的深度学习方法需要大量的像素级人工标注图像作为训练数据,使得这些方法所需的时间和金钱成本十分昂贵。为了减轻手工标注数据带来的沉重
学位
异构并行系统通常是指由中央处理器(Central Processing Unit,CPU)与图形处理器(Graphics Processing Unit,GPU)、现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)等协处理器共同组成的计算方式异构的高性能计算系统,因能提供更为高效的应用加速能力而被广泛部署,在大数据、人工智能等众多关键领域得到了广泛应用。当
Android(安卓)操作系统占据了智能终端操作系统的大部分市场份额,搭载Android操作系统的智能设备成为主流。由于移动智能终端携带了较多的用户隐私信息,同时Android应用的安全机制存在一定的局限,导致Android应用可能存在严重的安全隐患。需要对Android应用的安全机制特别是权限机制进行深入的研究,分析Android应用中的权限安全风险。同时关注和研究Android应用的安全漏洞,
学位
由于互联网信息的快速增长,用户面临着信息过载的问题。借助数据挖掘和人工智能领域中的相关技术,推荐系统能够帮助用户快速找到其感兴趣的信息,在社交网络、电子商务、在线阅读和广告投放等领域得到了广泛的应用。随着互联网应用的多元化发展,传统的推荐模型难以直接运用到新领域中以解决相应的问题。  以智能手机,笔记本电脑等为代表的电子产品更新换代通常较为频繁,而用户对于此类产品的消费周期则相对较长。传统的推荐系
学位