论文部分内容阅读
多核处理器能够充分利用线程级并行特性,相比于单核处理器主要依靠提升运行频率增强性能,具有更强的可扩展性,因而成为了处理器发展的重要趋势。多核处理器面临着日益严峻的功耗问题,而处理器低功耗设计目标又受到了电压紧急(VoltageEmergency)和热效应问题的严重阻碍。电压紧急是指超过预设阈值的负向电压波动,热效应是指功耗积累引起芯片温度快速升高的现象,这两种情况都可能使电路时延增大,引发时延故障。为了保证处理器运行时的正确性,需要为电压紧急和热效应留出较大的设计余量,导致处理器功耗的浪费和性能的损失。本文工作主要围绕不同体系结构处理器,研究面向电压紧急和热效应的可靠性设计,主要贡献及创新性研究成果包括: 1.提出一种基于存储级并行的指令调度方法,减少同时多线程处理器的电压紧急。 由于能挖掘更多的指令级并行特性获得性能提升,同时多线程(Simultaneousmultithreading,简称SMT)技术在商用处理器中得到了广泛采用。但在同时多线程处理器中,线程的长延时操作可能会引起资源拥塞,导致电压紧急。针对该问题,本文通过预测线程的存储级并行特性,叠加长延时访存,从而减少电压紧急。在SPEC CPU2000程序集上,分别对双线程和四线程结构开展实验,实验数据表明,与现有工作相比,所提方法能使电压紧急的发生频度分别降低22%和25%,并使公平性分别提高1.6倍和1.4倍。 2.提出一种基于电压特性的线程调度方法,减少片上多核处理器的电压紧急。 片上多核处理器发生电压紧急的主要原因是核间电压共振。本文通过分析并行程序执行特点,观察到单程序流多数据流编程模型可能使线程电压特性相似,导致核间电压共振频发,引起电压紧急。针对该问题,首先使用本征压降频度(Intrinsic Droop Intensity,简称IDI)量化评估线程的自有电压特性,然后提出一种基于回归树模型的在线IDI预测方法,在此基础上,提出了一种线程调度方法,将IDI异质的线程置于同一电压域,避免电压共振,从而减少电压紧急。在SPLASH2程序集上的实验数据表明,所提方法能达到87%以上的IDI预测准确率,能使电压紧急的发生频度降低60%,性能提高13%,而功耗开销仅为0.22mW。 3.提出一种软硬件协同的电压紧急可靠性设计方法,减少三维堆叠处理器的电压紧急及其故障开销。 三维堆叠能够增加传输带宽,缓解内存墙问题,因此成为一种重要的芯片封装技术。但相对于传统封装的处理器,三维堆叠处理器由于在一个芯片中叠加了多层晶片,电源网络的负载更大、供电路径更长,因而面临着更为严重的电压噪声问题。针对该问题,本文首先实验分析了三维堆叠处理器内电压噪声的分布特点:1)由于供电路径长短不一,处理器中各层芯片的电压噪声分布不均;2)紧急线程的垂直分布对电压噪声有显著影响。基于这两点特性,本文首先提出了一种分层隔离电压噪声的设计,避免单层故障传播到整个芯片。在此基础上,提出了一种紧急线程优先的线程调度方法,减少电压噪声。在SPLASH2程序集上,以四层的三维堆叠处理器为例开展实验,实验数据表明,所提方法能消除40%的电压噪声,降低电压余量并减少工作电压,从而节省18%的功耗。 4.提出一种基于热能功耗容量估算模型的多核处理器热能功耗管理方法。 功耗分配(Power Budgeting)和热能管理对多核处理器的效能起着关键作用,但是现有功耗分配方法仅关注芯片级功耗约束下的程序性能优化,难以保障芯片的热能安全;而现有热能管理方法仅关注在芯片热能安全下热能约束和功耗容量的静态关系,尚未考虑程序需求和特性,难以获得优化的程序性能。针对该问题,本文首先实验分析了不同线程策略下,热能约束与功耗容量之间的关系,提出了一种热能功耗容量的估算模型,作为连接性能优化和热能安全的桥梁。然后,基于该模型提出了一种满足热能约束的功耗分配方法,在保障热能安全的前提下优化程序性能。在PARSEC程序集上的实验数据表明,所提热能功耗管理方法使程序性能提高了19%。