【摘 要】
:
现代处理器普遍采用高速缓冲存储器(Cache)来缓解处理器与主存储器之间的性能差距。然而,Cache的访问速度随容量的增大而降低,对于频率要求与处理器核几乎保持同频的L1 Cache而言,其容量注定不能很大,从而限制了高性能处理器的发展。因此,探索Cache容量和频率之间的平衡,设计高频的大容量Cache具有重要的现实意义。此外,随着集成电路技术的发展,人们对于处理器性能的需求日益提高,多核乃至众
论文部分内容阅读
现代处理器普遍采用高速缓冲存储器(Cache)来缓解处理器与主存储器之间的性能差距。然而,Cache的访问速度随容量的增大而降低,对于频率要求与处理器核几乎保持同频的L1 Cache而言,其容量注定不能很大,从而限制了高性能处理器的发展。因此,探索Cache容量和频率之间的平衡,设计高频的大容量Cache具有重要的现实意义。此外,随着集成电路技术的发展,人们对于处理器性能的需求日益提高,多核乃至众核处理器成为必然趋势,而由此带来的存储一致性问题也日益严峻。Cache一致性是保证多核处理器设计正确性的必要条件,研究低延时的高效Cache一致性协议对提升多核处理器的整体性能十分关键。RISC-V是加州大学伯克利分校提出的一种开源指令集架构,其免费、灵活、可定制等特性使其迅速成为处理器领域的研究热点。本文基于RISC-V多核处理器,研究Cache结构和Cache一致性协议,旨在提升处理器的整体性能,主要工作内容和研究结果归纳如下。1.基于2分频存储体,设计了一种高频、低功耗、大容量的指令Cache—D2MB-ICache。为了保证D2MB-ICache的功能正确且在不降频的前提下扩容,设计了存储体的划分机制、反向时钟以及一个控制跳转访问的电路模块。VCS仿真和DC综合结果表明,与传统指令Cache相比,容量相同和容量扩大一倍的D2MB-ICache的最大工作频率分别提高了14.6%和6.8%,其整体性能也分别提高了10.3%和3.8%。此外,当容量为16 kB、32 kB、64 kB和128 kB时,D2MB-ICache的功耗开销分别降低了0.5%、16.1%、24.3%和24.8%。2.对TileLink协议中现有的Cache一致性协议进行改进,设计了一种低延时、高效的Cache一致性协议—DTBDN。该协议不仅定义了Cache的一致性操作,还涵盖了IO设备的访存操作流程。不同于原有的Cache一致性协议,DTBDN协议将私有副本和共享副本彻底区分开来。在DTBDN协议中,共享副本直接从L2 Cache中获取,从而避免了多个远程读响应同时发出的问题,降低了总线占用率和缺失代价。本文基于Gem5模拟器对DTBDN协议进行了性能测试。实验结果表明,在RISC-V四核处理器系统中,DTBDN协议的性能较MESI和MOESI协议分别提高了2.4%和1.6%;在八核处理器系统中,DTBDN协议的性能比MESI和MOESI协议提升了3.6%和2.5%。3.采用基于仿真的验证方法,构建了面向RISC-V多核处理器存储系统的验证平台。首先,分析验证目标系统的特性,提取Cache一致性协议和多核处理器的典型测试场景的功能点,其中典型测试场景主要用于多核处理器的并行操作验证和边界测试;其次,基于System Verilog语言建立了目标存储系统的测试平台;最后,采用随机测试为主、定向测试为辅的测试方法,基于汇编语言和C语言设计了面向RISC-V多核处理器存储系统的测试程序。验证平台最后输出的功能覆盖率报告为100%,达到了验证要求。
其他文献
横向双扩散金属氧化物半导体场效应晶体管(lateral double-diffused metal-oxide-semiconductor field effect transistor,LDMOS)作为一种典型的功率器件,凭借其共面电极易于集成的特点,被广泛应用于汽车电子、电源管理、照明驱动等领域。纵观LDMOS的发展历程,更高的击穿电压(breakdown voltage,BV)以及更低的比导
二十一世纪是信息时代,在面对高密度的信息存储、高效率的计算和信息安全等问题的情况下,经典信息领域面临着巨大的挑战,而此时量子信息技术的发展则变得尤为重要。当经典通信领域里面出现一系列不易解决的难题时,量子信息技术则可以提出相应的解决方法。量子计算、量子隐形传态和量子密钥分配等技术的发展,能够有效地保障信息传递的安全性。同时,量子态的叠加特性能够编码及存储更高密度的量子信息,而量子态的相干特性能够使
宽禁带氮化镓(GaN)基半导体物理特性优异,具有强击穿电场,高电子饱和速率和电子迁移率等,因此,非常适合制备功率微波电子器件,比如AlGaN/GaN高电子迁移率晶体管(HEMT)。然而,GaN基器件的反向漏电流远大于理论预测值。特别是,在高温和高压条件下长期工作时,反向漏电流会出现退化甚至失效行为,威胁器件的可靠性。低频噪声技术是研究缺陷相关的可靠性分析方法之一,能够获得与缺陷相关的能级深度和时间
随着移动互联网技术的飞速发展,庞大的数据交互量对于系统的传输容量提出了新的挑战。硅光子SOI(Silicon on Insulator)平台由于其高折射率对比度、低成本以及与成熟的互补金属氧化物半导体(Complementary Metal-Oxide-Semiconductor,CMOS)技术兼容等优点,成为了开发一些超高密度片上光子集成电路的优良平台,引起了广泛的关注。然而,为了满足光互连容量
工业过程的稳定运行以及产品的产量质量是现代工业的核心竞争力,而作为过程控制领域的关键技术以及研究热点,故障监测技术则是提高核心竞争力的一个有效途径。随着计算机技术的提升、传感器以及集散控制系统迅速发展,海量的工业过程数据得到了保存和记录,因此,基于数据的故障监测技术应运而生。多块模型作为一种新的集成监测框架,能够对分布式及具有复杂工况的流程工业进行及时、有效的监测。本文在多块模型的框架下,对基于数
钼基过渡金属硫族化合物(TMDs)被认为是实现纳米技术应用前景的功能材料,未来在量子物理、微电子学、超导等领域有大展身手的可能。当前使用的制备方法之中,化学气相沉积法(CVD)被认为是一种有前景的方法。之前的研究中通常使用固体前驱体(如金属氧化物和硫粉)作为CVD合成TMDs的生长原料。然而,不同的前驱体之间蒸气压差异较大,在CVD反应中实现前驱体的稳定供应较为困难,导致反应可控性和再现性较差。以
基于非冯诺依曼架构的存算一体(Computing-In-Memory,CIM)芯片在处理卷积神经网络算法领域展现了独特的优势。该架构芯片的核心组成是存算器件构成的存算单元阵列,存算单元输入、处理和输出信号均为模拟信号,读出电路负责将存算单元以电流形式输出的运算结果进行取样量化。存算一体芯片意在突破冯诺依曼架构带来的访存功耗墙瓶颈,且该架构芯片中的阵列和读出电路具有高密度的寄生负载,因此面向存算一体
在战场、重大事故中产生的不可控大量失血是许多创伤性死亡的主要原因,而常用的止血方法如按压止血、手术缝合或者纱布包扎无法在创面严重出血或大量渗血的情况下达到理想的止血效果;此外,传统的止血方法可能会给患者带来二次伤害,或不适用于人体内部等一些不可按压部位的止血。因此,开发新型止血材料具有重要的意义。根据人体自身止血机理发现,血凝块的形成是止血中最重要的部分,因此对于新型止血材料的研究也主要集中在如何
近年来,太赫兹有关技术领域蓬勃发展。超构材料作为一种新型人工复合材料具有普通材料所不具有的奇特性质,可以通过对结构的特定设计获得想要的磁导率和介电常数从而实现操控电磁波的目的。超构材料与太赫兹波相互作用强,因此它被广泛应用在太赫兹技术领域,我们见证了太赫兹超构材料共振器件的快速发展。法诺谐振和电磁诱导透明作为两种典型的谐振效应具有许多奇特的电磁特性,如高Q值、非对称线形、非线性、慢光效应等,它们在
近年来,利用3D打印技术制备连续纤维增强复合材料已经成为研究热点,引入智能性打印基材则可进一步拓展复合材料的功能和应用前景。借助打印技术引入连续纤维可定制化生产轻质高强复合结构材料,一体成型,降低成本。打印过程中,将形状记忆智能高分子基材与连续纤维复合,能够在特定刺激下改变其形状,可用来设计增强结构的自展开或自适应功能,未来在航空航天等领域有着巨大的应用潜力。然而,前期研究表明,打印工艺对连续纤维