片上多处理器中cache的研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户：xuyaya

【摘要】

：

片上多处理器(CMP)是当前主流的微处理器体系结构，它利用现有的海量晶体管资源在单个芯片上集成多个处理器核，通过多核并行执行的方式开发指令级和线程级等各个层面的并行度来

【作者】

：

肖俊华

【机构】

：

中国科学院计算技术研究所

【出处】

：

中国科学院计算技术研究所

【发表日期】

：

2008年期

【关键词】

：

片上多处理器高速缓存栈距离剖析 Cache压缩

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

片上多处理器(CMP)是当前主流的微处理器体系结构，它利用现有的海量晶体管资源在单个芯片上集成多个处理器核，通过多核并行执行的方式开发指令级和线程级等各个层面的并行度来提高性能。　　 CMP中的cache，特别是最底层cache是影响其性能的关键，也是目前学术界研究的热点。在本研究中将最底层cache设定为L2 cache。本论文从CMP中cache设计面临的线程间干涉、有限的片外带宽和增长的线延迟三个挑战出发，就如何减少线程间干涉，增加有效的片上cache容量和有效的片外带宽，缓解线延迟的影响和减少平均内存访问延迟进行了深入的研究，提出了一种共享cache划分策略，一种压缩存储系统，以及一种适用于CMP的cache结构。本论文的主要创新点及贡献包括：　　 1.提出一种适用于CMP的共享cache动态划分策略——基于栈距离剖析的cache划分策略。该策略利用栈距离剖析这一特性，在不同访问存储流之间显式分配cache空间，动态调节cache容量使之满足同时执行的线程的需求，解决了线程之间的干涉问题。该划分策略采用硬件计数器动态获得每个线程的栈距离剖析，根据栈距离剖析结果应用划分序列算法获得cache划分序列，并利用修改的LRU替换策略保证线程实际分配的cache容量接近划分序列的值。多道编程测试程序的性能评测结果表明，与标准LRU替换策略相比，采用基于栈距离剖析的cache划分策略，组合IPC平均提高了11％，加权加速平均提高了9％。　　 2.提出一种CMP中的压缩存储系统，该系统包括L2 cache压缩和接口压缩两个部分，通过存储和传输压缩格式的数据来增加有效的片上cache容量和有效的片外带宽。文中提出了带相邻匹配的基于值和端的压缩算法和基于拼接的cache压缩方法。带相邻匹配的基于值和端的压缩算法采用硬件编码方式对每个32位的字进行编码，以压缩格式存放频繁出现的值、符号位扩展数以及相邻匹配字，达到释放存储空间的目的。这一算法硬件实现简单，开销小，解压延迟低。在cache压缩实现中，采用基于拼接的cache压缩方法来降低cache管理复杂度和简化设计。实验结果表明，采用本文提出的压缩存储系统，多线程测试程序性能平均提高了12％。　　 3.提出一种适用于CMP的cache结构——延迟和容量权衡的cache结构(TCLC)。该结构是一种混合私有结构和共享结构的设计，核心思想是动态识别cache块的共享类型，根据不同共享类型分别对其进行优化，对私有cache块采用迁移的优化策略，对共享只读cache块采用复制的优化策略，对共享读写cache块采用中心放置的优化策略，以期达到访问延迟接近私有结构，有效容量接近共享结构的目的，从而缓解线延迟的影响，减少平均内存访问延迟。实验结果表明，采用TCLC结构，相对于私有结构基于吞吐量的性能提高了13.7％，相对于共享结构基于吞吐量的性能提高了12％。　　本文重点研究了CMP中的cache技术，提出了一些新的策略和结构，取得了一些有意义的成果，为未来CMP的cache设计做了有意义的探索工作。

其他文献

基于网格的物流快递公共信息平台的研究与设计

随着经济的发展和信息科技的进步，电子商务逐渐成为当今业务贸易的趋势。快递行业作为近来新兴的行业，更是得到了飞速的发展，其对信息处理的要求也越来越高[1]。然而，快递行业的

学位

网格物流快递公共信息平台WSRF体系结构

多核分类器性能优化方法研究

分类器的核化构造了一个特征空间,在这个特征空间中,原本线性不可分的样本更容易被正确分类。特别是多核的引入,使得分类器从多个不同的角度对数据进行刻画。相比单核分类器,

学位

核函数经验核映射隐式核映射多核分类器代价时空复杂度

基于客户端蜜罐技术的HTTP木马网络监测系统设计和实现

随着互联网在中国的普及程度越来越高，互联网已经成为我国信息化建设的重要基础设施。在这样的背景下，互联网的安全状况不容乐观，WEB安全威胁替代病毒、蠕虫等传统安全威胁成为

学位

蜜罐技术HTTP木马网络监测WEB安全网页木马代码形式

一种基于缓存机制的服务调用加速方法

随着Web服务相关规范、标准、技术的完善与发展，Web服务正逐渐被广泛应用到各类信息资源集成与共享应用中。在本人参与的全国科技信息服务网项目建设中，分布在全国各地的科技信

学位

Web服务调用服务访问中介消息缓存二次开发

参数自适应的层级过滤跌倒检测方法研究

跌倒已成为老人意外死亡的重大诱因之一，严重威胁着老年人的健康和生命。提供实时、精准、可靠的跌倒检测及报警机制，对老年人的生活质量和生命保证有重大的研究意义和应用价值

学位

老年人跌倒信号检测层级过滤检测模型姿态估计自适应预处理

Web服务运行监控管理架构的研究及基于Axis的实现

近年来，中国的电子商务和电子政务发展迅速，已经成为不可或缺的一部分渗透到社会经济的各个领域。随着电子商务和电子政务的不断推广，人们开始注意到电子商务和电子政务系统有时

学位

网络服务运行维护监控管理架构Axis

Robocup中型组足球机器人视觉系统的研究与应用

机器人是一项包含多项技术领域的综合性研究项目,自主移动机器人是机器人学科中技术含量比较高的一个分支,具有广泛的应用前景。本文在阅读大量文献的基础上,以华南理工大学

学位

RobocupRobocup足球机器人足球机器人机器人视觉机器人视觉中型组机器人中型组机器人图像处理图像处理全景视觉自定位全景视觉自定位

基于区域的图像检索及标注算法研究

随着互联网的飞速发展、网络平台的多元化,以及数码电子设备越来越普及,数字图像的存储量正呈爆炸性地增长,如何快速地查询、高效地组织这些图像成为一个亟待解决的问题。显

学位

图像检索区域图像标注区域标注图像内容表示

VegaDLib：面向服务的数字图书馆构建平台研究

随着计算机和互联网技术的迅速发展和逐渐普及，数字图书馆作为一种重要的知识共享平台受到了越来越多的关注，不仅在商业领域受到了产业界的重视，而且在学术领域同样具有研究价值

学位

数字图书馆知识共享平台Web服务映射机制数据存储

基于点特征的图像匹配算法研究

本文主要研究基于点特征的图像匹配算法。点特征是图像上具有明显特性并能够把目标标识出来的点，它可以较好的描述目标的特征。点特征检测和图像匹配技术在计算机视觉和图像理

学位

特征点检测图像匹配电子稳像加速算法

片上多处理器中cache的研究

其他学术论文