阻变存储器高效低能耗优化技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:movax
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今的数据密集型应用已经展现了对大容量主存的迫切需求。然而目前构建主存的实际选择——动态随机存储器(Dynamic Random Access Memory,DRAM)面临着低可拓展性、低密度、短刷新间隔、高能耗等挑战,DRAM容量与当今数据密集型应用所需的主存容量相距1000倍以上。阻变存储器(Resistive Memory,ReRAM)作为一种新兴的非易失内存技术,具有高可拓展性、高密度、低空闲功耗以及非易失性等优点。通过应用独特的交叉开关(crossbar)结构,ReRAM可以构建密度极高的存储阵列,极有希望用作存储级内存,从而在未来的主存系统中取代很大部分的DRAM,满足当今数据密集型应用对大容量主存的需求。然而,crossbar ReRAM自身的非理想因素以及不对称特性导致了较差的写性能、较高的写入和泄漏能耗以及软硬错误。特别是随着ReRAM阵列尺寸的增大,其性能和能耗将会面临更严峻的挑战,在一定程度上限制了ReRAM主存系统的应用。本文关注于crossbar ReRAM的性能和能耗优化,同时也考虑其可靠性,从而构建高效低能耗的ReRAM主存系统。
  针对应用1/2电压偏置机制的ReRAM,提出了一种基于SLC(Single-Level Cell) ReRAM非理想因素的优化技术(CACF),解决由非理想因素所导致的写性能差、泄漏能耗高以及数据可靠性低等问题,从而同时改善SLC ReRAM主存系统的性能、能耗和可靠性。通过分析SLC ReRAM的非理想因素(如IR drop问题、对写入数据模式的敏感性、写干扰)对其性能、能耗和可靠性的影响,CACF提出了三个相应的优化组件,即双端写驱动设计、分区数据自适应翻转技术以及制程变异感知的RESET干扰探测机制。具体地,双端写驱动设计在ReRAM阵列位线的两端都应用写驱动并选择性使能写驱动,从而有效地缓解位线上的IR drop问题。分区数据自适应翻转技术在ReRAM阵列不同的区域中自适应地应用两种翻转机制来综合性地优化写入数据模式,从而同时改善ReRAM的性能、能耗和可靠性。制程变异感知的RESET干扰探测机制通过紧凑的概率模型来估算制程变异下的累积RESET干扰分布并条件性执行刷新操作,从而以低开销解决了写干扰问题。实验结果显示,CACF相比双端接地设计可以提升26.1%的每周期指令数(Instructions Per Cycle,IPC),减小22.4%的主存访问延迟,缩短20.1%的应用执行时间,降低21.6%的能耗。
  针对应用1/3电压偏置机制的ReRAM,提出了一种基于SLC ReRAM不对称特性的优化技术(A-ReRAM),解决由不对称特性所导致的性能下降和能耗浪费问题,在保证可靠性的前提下提升SLC ReRAM主存系统性能,降低其能耗。A-ReRAM探索了SLC ReRAM的三种不对称特性,即访问延迟的不对称性、选定字线上高阻态与低阻态单元潜行电流的不对称性以及读写干扰的不对称性,然后提出了相应的优化技术。通过最小化字线和位线上的IR drop路径并对ReRAM阵列进行细粒度的块划分、利用ReRAM固有的内存处理能力来定期计算选定字线上低阻态单元的比例范围并将最合适的写延迟暴露给内存控制器调用、应用微体系结构级的方案处理读写干扰等方法,A-ReRAM有效地降低了访问延迟和能耗。实验结果显示,相比双端接地设计和当前最优的方案,A-ReRAM在保证数据可靠性的前提下,可以提升29.7%和19.2%的IPC,减小26.4%和12%的主存访问延迟,降低21.1%和11.3%的能耗。
  针对TLC(Triple-Level Cell)ReRAM,提出了一种压缩空间感知的数据编码技术(Tiered-ReRAM),根据缓存行压缩节省的空间来动态地应用最合适的数据编码技术,从而以极小的空间开销来降低TLC ReRAM主存系统的写延迟和能耗。Tiered-ReRAM由三个组件构成,即分层的crossbar阵列设计、压缩空间感知的不完全数据映射以及压缩空间感知的翻转机制。具体地,基于发现双端接地设计中IR drop的数量取决于位线长度,分层的crossbar阵列设计使用隔离晶体管将每条冗长的位线分割成近段和远段,使近段具有较低的写延迟和能耗。而且,在近段中,压缩空间感知的不完全数据映射根据每个缓存行压缩节省的空间来动态地选择最合适的不完全数据映射编码,以极小的空间开销来进一步降低写延迟和能耗。此外,在远段中,压缩空间感知的翻转机制根据每个缓存行压缩节省的空间来动态地选择最合适的翻转机制,确保更多的高阻单元写入到ReRAM阵列中,从而以极小的空间开销有效地降低泄漏能耗。实验结果显示,相比双端接地设计结合IDM((8,6),2)编码的方案,Tiered-ReRAM可以提升30.5%的IPC,减少35.2%的写延迟,缩短26.2%的读延迟,降低35.6%的能耗。
其他文献
本文主要是考述自清代以来关于《晋书》研究的一系列著作,以总结这一段时间内,在《晋书》研究领域内取得了哪些具体的成就,我们如何运用这些成就,以及将来在《晋书》研究领域主要还有哪些问题需要解决等。  在具体的考述过程中,把清代以来关于《晋书》的著作主要分成三部分,即各种关于《晋书》的补表和补志、关于《晋书》的考校和注释、近代以来关于《晋书》的研究及评价。每一部分基本上以时间为顺序,逐一考述各种著作。在
学位
晚清湖湘学者在老庄学的研究上颇有特色,晚清湖湘老庄学的兴起,是湖湘文化传统精神和现实激烈碰撞的结果,也是晚清湖湘人文荟萃的社会和文化氛围培植下的结果,当然,也与学者自身的教育背景有关。  以郭庆藩、王先谦、王闿运为代表的湖湘老庄研究者基本上是乾嘉考据派的传人。魏源《老子本义》在思想价值方面显得很突出,虽然没有套用西学的方法来阐释《老子》的本义,从这一点来说,近代性显得不足,但魏源在这里毕竟比传统的
学位
旅游史研究在旅游学和历史学的研究中皆未深入展开,现代旅游史研究更少有人涉足。长沙现代旅游业的发展已有近三十年的历史,既是中国现代旅游发展的缩影,也是中部地区省会城市现代旅游发展的典型代表。当前,经济全球化日益明显,金融危机日趋加剧。危机蕴涵契机,本文根据湖南省委省政府提出的“把湖南省建设成为世界级旅游目的地”和长沙市委市政府提出的“将长沙建设成为全国知名的文化旅游休闲之都,实现长沙由国内旅游向国际
作为一种新兴的微通道换热技术,毛细微槽群蒸发热沉可以利用毛细力使液体在沿微槽道流动的同时能够在三相接触线附近的扩展弯月面区域内形成具有高强度蒸发能力的薄液膜而具有较理想的换热效果,因而能用来实现极高换热系数和热流密度的换热目的。本文旨在通过对竖直矩形毛细微槽群蒸发热沉的实验与理论研究,揭示液体在竖直矩形微槽中的润湿、流动和相变换热机理,为下一步研究开发高性能矩形微槽群相变换热器提供一定的理论基础和
以甲醛作为室内有机挥发物的代表,以PM10作为室内颗粒污染物的代表,通过实验研究证明水溶液可有效吸收室内甲醛,185nm/254nm紫外光可有效降解水中甲醛,水膜对PM10的去除效果有限。利用水溶液吸收甲醛的实验表明:空气中甲醛的初始浓度对水溶液吸收甲醛的效果影响很大。空气中甲醛初始浓度越高,水溶液吸收甲醛的效果越好。在最初30分钟内空气中52~59%以上的甲醛可以被水溶液吸收,在60分钟内空气中
永磁同步电机(PMSM)因为具有体积小、结构简单、工作效率和功率密度高等优点,在交流调速系统中的地位变得日益重要。因此对永磁同步电机进行高性能的控制是现阶段交流调速系统研究的重点。永磁同步电机控制系统一般采用速度环,电流环的双环控制结构。控制系统的暂态和稳态特性很大程度上由电流环的性能决定,而转速环的性能直接依赖于反馈转速的精确性。  目前,预测电流控制从原理上提高了电流环的暂态响应速度,是现在的
电力系统是当今世界实现能源生产与能源输送最为重要的角色,电力的可靠供应关系着人类生活与生产的方方面面。及时快速地发现变压器等电力网中非常关键的设备出现的故障问题,对于提高电力系统的供电可靠性具有重要意义。对充油电力设备的故障检测,普遍采用的是分析油中溶解气体这一方法。传统的在线气相色谱分析法存在组件复杂、运行成本高和安全性差等缺点,而采用光声光谱技术的在线监测拥有检测灵敏度高、维护方便、检测时间短
学位
该文是利用等离子体化学气相淀积法(Plasma Enhanced Chemical Vapor Deposition,PECVD),在低温低压下,使用有机物TEOS(正硅酸四乙脂,Tetraethylorthosilicate,Si(CHO))为反应源在硅片表面上生长P-SiO介质膜以及P-SiON钝化膜,利用制程参数(RF功率、基板温度、气体流量以及反应压力)的改变,来探讨对薄膜的生长特性、硬度
论文介绍了并联型有源电力滤波器的原理和常规控制思想及基于此控制思想的控制方法.在此基础上提出了一种新的控制思想以及建立在该控制思想上的两种不同的控制方法.分析了PWM的原理、几种数字PWM的形成方法以及并联型有源电力滤波器直流侧电压的控制.运用两种控制方法,对并联型有源电力滤波器进行了计算机仿真,仿真结果证明了两种方法的正确性以及并联型有源电力滤波器具有良好的补偿性能.论文详细分析了并联型有源电力
学位
随着测序技术的不断成熟和广泛应用,以测序技术为驱动的基因组、转录组等多组学的研究得到了跨越式发展,推动了基因组科学、遗传学、临床医学等多学科的变革。基因组变异检测作为基因组研究中最为核心和关键的环节,对于基因组注释、与疾病和表型的关联分析、临床诊断等具有重要的意义。然而,由于基因组存在大量复杂的结构变异,现有的检测技术和方法在变异检测的准确性、敏感性、全面性以及性能上已无法满足当前基因组前沿研究的
学位