UniCore-3处理器Load/Store执行部件的设计与性能评测

来源 :北京大学 | 被引量 : 0次 | 上传用户:cdelphi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着集成电路工艺的不断发展,处理器与主存之间的速度差距日益增大;同时,随着超标量流水线、乱序发射执行等先进技术的引入,处理器的计算能力得到了大幅度的提升,从而对存储子系统提供与保存操作数的速度提出了更高的需求;此外,多核缓存一致性(Cache Coherence)等问题也使得访存行为和访存机制愈发复杂,这也进一步提升了对访存性能的需求。访存效率问题已成为现代处理器性能的瓶颈所在,作为处理器中访存指令的执行单元,Load/Store执行部件(Load/Store Unit,LSU)的设计对访存指令的执行效率乃至处理器的整体性能至关重要。  本文针对上述问题,基于北京大学微处理器研究开发中心正在研发的UniCore-3超标量多核微处理器,通过对商业微处理器的调研及对LSU设计要素的分析,设计并实现了UniCore-3处理器中的LSU部件,并对其进行了性能评测和优化。主要内容包括:  1.分析了访存指令的执行顺序、Cache命中时访存指令的执行时间、失效损失、多核缓存一致性等LSU设计的关键要素,涉及访存指令的调度、执行、多核支持等多个方面。每个要素都结合商业处理器的设计对常见的设计技术进行了分析和探讨,并结合UniCore-3的设计需求,确定了LSU在各个要素上的设计取舍,进而形成了UniCore-3 LSU设计规范。  2.以UniCore-3 LSU设计规范为基础,分析LSU各设计特性的具体实现方式,包括访存流水线、非阻塞访存、多核支持等多个方面。在此基础上,整理并总结出了LSU整体的模块结构及子模块的具体功能,进而得到了UniCore-3 LSU的完整RTL设计。  3.从流水线阻塞情况、与下一级存储的交互情况、与UniCore-2访存单元之间的性能对比等多个方面,对UniCore-3 LSU进行了性能评测,检验了所完成的RTL设计及所采用的设计技术的有效性,并对评测巾发现的设计问题进行了优化改进。  
其他文献
对计算机系统性能的追求是无止境的。计算机系统的性能与编译器等系统软件密切相关。编译器生成的指令类型、数量和排列都会影响计算机系统的性能。随着处理器结构日趋复杂,编
Linux内核发展迅速,已经被应用于多个平台上,但同时对Linux内核的开发和维护提出了更高的要求。为了提高调试和剖视Linux内核的效率,节约时间成本,Linux内核跟踪工具应景而生。Ft
行人检测是车辆自动驾驶系统的核心模块,主要通过安装在汽车上的雷达、摄像头等设备获取道路状态信息,判断车辆行驶前方是否有行人,为车辆自动驾驶过程中报警、自动减速或者紧急
汽车主动安全是一种使汽车在事故可能发生时能够主动采取措施,避免事故发生的技术。盲点探测系统作为汽车主动安全系统的重要组成部分,在车辆进行并道或超车时,能有效降低因视觉
本论文的主要内容是视频图像质量检测技术的研究与实践。视频图像质量的评价方法有很多种,通常从清晰度、色偏、对比度和信噪比等几个方面来衡量,而对图像清晰度的检测是难点
处理器性能一直是处理器设计的主要目标。如何充分开发和利用指令间的并行是提升单核处理器性能的关键。超标量技术是现代处理器设计中广泛使用的技术,它通过多发射、动态调度
国家及自治区高度重视新疆少数民族语言信息处理,从早期的文字处理技术,到目前语音处理技术以及汉语与少数民族语言的自然语言理解处理技术等,所有工作都是围绕“缩小民族间数字
Web应用安全是信息安全的一个分支,主要涉及Web站点、Web应用和Web服务的安全问题。随着Web应用安全事件的频繁出现及其带来的巨大危害,Web应用的安全问题已成为业界广泛关注的
目前,随着计算机和数字技术的迅速发展,图像已经成为信息存储和传递的重要工具。深度图作为表征场景三维结构的图像,在三维重建领域发挥着非常重要的作用。然而在实际应用中,普通
近年来随着智能手机等移动终端的不断发展,很多传统意义上个人电脑和其它影音设备的功能也逐渐由移动设备上的各种各样的应用所取代。然而,受自身性能的影响和束缚,移动设备的相