嵌入式处理器中低功耗的BTB研究与设计

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:eduaskbj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路制造工艺的进步和微处理器设计技术的发展,处理器的流水线级数不断加深,由控制冒险引起的吞吐率下降也随之增大,在现代深流水处理器中,分支预测技术对性能的提升起着尤其重要的作用。随着处理器规模的增大,为了追求高吞吐率,分支预测器的结构越来越复杂,用于目标地址推测的分支目标缓冲器(BTB)的容量也越来越大,而通常BTB是由SRAM单元组成的Cache结构,它的功耗开销也就成了值得关注的问题。在嵌入式处理器中,由于面积和能耗等因素的限制,设计者需要在性能和实现代价等方面做出权衡,选择面积和能耗利用效率最高的设计方案。因此,探索在嵌入式处理器中采用何种结构的分支预测器和BTB可以满足应用需求且使处理器能耗达到最低对嵌入式处理器的低功耗设计具有重要意义。为了使BTB功耗和性能的优化研究具有更高的精确度和较强的应用价值,本文实验基于RTL级硬件平台,并选择具有代表性的单发射7级流水的嵌入式处理器作为基础处理器。另外,实验还采用基于SimPoint统计采样的SPEC 2000快速模拟方法有效减小了仿真时间。本文根据嵌入式处理器中分支预测的应用需求将功耗作为首要的设计目标,在实验中将方向预测器和BTB融合为统一的模块,设计了基于RAM比较标签存储结构的BTB,并通过硬件仿真方法对不同参数的BTB结构的性能与能耗进行了研究,实验选取了128分支项32路组相联的BTB为最优结构,并将它的存储体改用CAM比较标签的存储结构来实现,相对于基于RAM比较标签的存储结构,其功耗降低了37.17%,此外,本文还通过性能与实现代价的比较选取了Round Robin为该BTB结构的最优替换算法。在此基础上,本文还提出了一种通过减小无效访问来降低BTB动态功耗的跳跃访问算法,并分析了算法在嵌入式处理器中的设计折衷,最后在硬件平台上对算法性能进行了评测:在128分支项的BTB中,跳跃访问算法可使动态功耗降低72%,而CPI损失仅为0.013%。
其他文献
随着技术的进步和需求的不断提升,下一代网络体系结构逐步显现,它能够提供集数据、图像为一体的多媒体的综合业务,已经成为了电信网络的发展热点。媒体网关在下一代网络中扮演着
随着现代电子、通信等技术的发展,人们对锁相环的性能提出了越来越高的要求。为提高国内的IC设计水平,以及从国防到商用领域考虑,开发出属于自己的高性能锁相环产品是非常必要的。本文针对应用于高性能DSP中的频率合成器的设计,在研究了锁相环理论和整体结构的基础上,进行了环路参数设计、噪声性能估算以及电路设计仿真。采用1.2V电源的Charter 0.13 ? m混合信号CMOS工艺,设计实现了一款高性能可
混沌是一种普遍存在于非线性系统的具有确定性和类随机特性的动力学行为,混沌序列的对初始条件的敏感性、貌似随机的行为和连续宽带功率谱等特性,使其在通信领域具有广泛的应用
2019年,国有企业改革发展进入了一个新的阶段,国企必须积极应对国际国内宏观经济形势的新变化,自觉适应建立现代企业制度的新要求,准确把握职工思想观念多元多样多变的新特点
期刊
本文通过对荣华二采区10
期刊
计算机断层成像技术在最近20年发展迅速,成果丰富。该技术已被广泛应用于众多邻域,如医学诊断、非破坏性工业测试和雷达等。2002年,Katsevich提出了锥束重建算法,由于该算法
学位
本文通过对荣华二采区10
期刊
物业服务联系着千家万户,直接关系着群众的幸福生活.广州越秀物业发展有限公司(以下简称“越秀物业”)自1992年成立以来,在企业发展过程中发挥党组织的战斗堡垒作用,始终坚持
期刊
高高宽比X射线聚焦衍射光学元件是硬X射线成像系统的核心光学元件,在激光惯性约束聚变等离子体诊断、X射线天文望远镜等领域有着广泛的应用。高高宽比的X射线聚焦衍射波带片