片上多核系统结构研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户：wwxxzz123

【摘要】

：

片上多核结构是使用丰富的片上资源的有效方法之一，是未来高性能处理器发展的一个趋势。本文主要进行片上多核结构的研究，具体的研究成果如下：　　 1.设计了片上多核结构：本文设

【作者】

：

杨金刚

【机构】

：

中国科学院计算技术研究所

【出处】

：

中国科学院计算技术研究所

【发表日期】

：

2008年期

【关键词】

：

互连网络片上多核系统片上资源多媒体技术性能评估

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

片上多核结构是使用丰富的片上资源的有效方法之一，是未来高性能处理器发展的一个趋势。本文主要进行片上多核结构的研究，具体的研究成果如下：　　 1.设计了片上多核结构：本文设计了具有“片上集群”特征的多核结构。整体结构是用基于router的二维mesh网络连接起来的多个相同的小核。每个小核是一个兼容MIPS指令集的简单通用处理器，具有通用处理器的所有特征。每个小核访问自己独立的物理内存，不共享任何内存空间。为了提供大量的计算能力，小核进行多媒体指令集扩展，开发应用中大量的细粒度数据并行性。片上网络采用x-y维序路由的算术运算路由算法，虫蚀消息传递方式进行通信。消息传递函数组成消息通信库，作为应用程序接口提供给应用程序员使用，进行多线程并行编程。　　 2.讨论了多核结构对多媒体应用的适应性，并用多媒体扩展指令对解码算法中的整数DCT反变换计算过程进行了并行优化实现：首先分析了多媒体应用及媒体处理器的特点，然后以AVS解码过程为例子，提出了多核结构如何对其进行并行优化的方法。本文设计的多核结构具有“可配置”的特点，可以很好的适应不同应用。将解码应用划分成多线程并映射到多核结构上后，多核就具有针对媒体解码应用而设计的专用功能媒体处理结构的特征，而不同的映射方式也使得多核具有不同的特征。对其他应用可以进行类似方式的多线程编程和映射，将多核配置成适应具体应用的专用结构。　　 3.对CORDIC算法实现的正余弦求值电路进行了优化，以便多核结构可适应大型科学计算，并可扩展到信号处理领域：首先，本文发现并证明了正弦值与输入参数前导0个数之间的关系：输入参数x在[0，1]范围内，正弦值前导0个数比x的前导0个数至多多一个。这样，可以在迭代开始前对输入参数x的前导0计数，并根据结果的精度要求，得出需要的迭代次数，并用于迭代过程的控制，在结果得到足够的有效数字后，终止迭代过程。这使计算过程中的迭代次数从固定次数变成随输入参数范围和结果的要求精度不同而变化，最坏情况下的次数与原来固定次数相同，最好情况下的迭代次数是原来固定次数的0.27。在输入参数等概率的情况下，平均时延是原来的2/3。其次，压缩了反正切表，节省了电路面积。在CORDIC算法中，2-i的反正切表是必需的，而且表的项数和每项的宽度较大占用了可观的面积。本文通过观察反正切表，发现在索引号32以后的表项与2-i相等。因此，提出了用移位寄存器取代反正切表表项的压缩反正切表的方法。通过用移位寄存器取代反正切表索引号32后的表项，对反正切表进行了简化，使反正切表的硬件综合面积减少了约1/3。在每个小核上实现超越函数，可以使多核结构更加接近原来大型计算机的处理能力，也可以扩展多核在信号处理领域的应用。　　最后，对设计的多核结构进行了性能评估并对全文进行了总结。在单核上，通过对多媒体编解码应用中重要算法之一的整数IDCT变换进行细粒度数据并行优化，获得了2.93倍的加速比。对128X128的密集矩阵乘法进行细粒度的数据并行优化和粗粒度的线程并行优化，可获得近似线性加速比。

其他文献

基于ASR文本的视频语义概念检测技术研究

视频是集图像、声音、文字等为一体的综合性媒体。随着互联网技术的发展和网络带宽的提升，网络视频数据量呈爆炸式增长，从浩瀚的视频数据库中检索感兴趣的资源，传统的基于关键词

学位

视频检索高层语义特征文本分类语义概念融合概念相关性自动语音识别

面向城市场景的信号覆盖快速计算系统研究

随着数据通信与多媒体业务需求的发展，研究城市场景室外信号传播特性，建立有实用意义的信号传播模型，能够为无线通信系统设计提供依据，从而提高和改善特定区域的信号覆盖能力。传

学位

城市场景信号覆盖电磁计算光柱跟踪算法网格剖分

视频编码器中帧间预测的算法优化和芯片设计

二十世纪九十年代以来，数字视频压缩技术被广泛应用于通信、个人计算机、广播电视、消费电子等领域，堪称数字媒体产业的最核心技术之一。以MPEG-2为代表的信源编码标准获得了巨

学位

视频编码器帧间预测芯片设计算法优化AVS视频标准

适用于H.264及AVS的运动估计和帧间预测的设计实现

目前，数字视频编解码技术发展非常迅速。越来越多的新技术被纳入到新的编解码标准中。国际上的H.264以及我国自主开发的AVS就是其中两个最新的标准。H.264标准同MPEG-4 ASP以

学位

数字视频编解码系统AVS编码运动估计帧间预测H.264标准

矩阵变量稀疏表示与鲁棒低秩方法研究

机器学习方法通常分为有监督学习和无监督学习。分类器是有监督学习中的研究热点之一，子空间分割是基于子空间学习的聚类方法，属于无监督学习。机器学习的研究对象是数据，而涉及

学位

子空间分割分类器稀疏表示低秩表示

支持多模式数据过滤和聚合的RFID中间件系统设计与实现

射频识别(Radio Frequency Identification RFID)中间件是RFID技术和企业级应用程序的桥梁，RFID中间件主要功能包括：采集并解析RFID读写器数据：有效的过滤冗余数据：根据应用程序

学位

多模式数据过滤数据聚合射频识别中间件系统数据冗余Java平台

无线传感器网络低延时路由协议研究与实现

无线传感器网络是一种新兴的信息获取技术，可应用于工农业控制、生物医疗、环境检测等诸多领域。路由协议是无线传感器网络底层支撑技术之一，对路由协议的研究具有重要意义。对

学位

无线传感器网络路由协议贪婪邻居表数据传输延时最短路径求解无线链路

面向多视点视频系统的立体匹配与虚拟视合成技术研究

随着人们对视频服务要求的不断提高，传统单路视频所提供的简单视觉信息，已经不能满足人们对于真实场景立体视觉体验的需求，多视点视频技术应运而生。多视点视频系统可以提供场景

学位

多视点视频系统虚拟视合成立体匹配图像分割自适应权重图像质量

专家搜索关键算法研究

随着信息检索技术的发展，用户的需求也更加多样化，传统的信息检索越来越不能满足用户的需求。搜索技术发展趋向于个性化、智能化、精准化。本文的研究，专家搜索是一个比较新的研

学位

专家搜索关系网络信息检索评测系统

基于正则化与回归学习的图像超分辨率重建及应用

图像超分辨率重建是以一种软件手段增强或融合同一目标或场景的单幅或多幅低分辨率(Low Resolution，LR)图像获得一幅高分辨率(High Resolution，HR)图像的技术，它为后续的特征提

学位

图像处理超分辨率重建正则化回归学习质量控制

片上多核系统结构研究

其他学术论文