运动估计算法的可重构VLSI结构研究与设计

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhaihoufu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,作为多媒体核心的数字视频技术得到了飞速发展。而运动估计(ME)算法及其实现技术作为诸多视频压缩标准实现的核心部分,在研究领域和业界引起极大的关注。可重构计算技术的出现在算法的ASIC和软件两种传统的实现方式之间架起了一座桥梁,使用户可以在性能与灵活性之间获得较好的折中。本论文将重点讨论基于可重构计算技术的ME算法的VLSI实现问题。  在介绍课题的总体背景后,对可重构计算技术、块匹配算法(BMA)的研究现状及其 VLSI实现和BMA的可重构实现发展现状等方面的课题相关技术做了详尽介绍和深入探讨。  本文的主要工作如下:  可变块大小ME已被新的MPEG-4 AVC/H.264标准采纳,而以往支持全搜索块匹配算法(FSBMA)的结构并不适合可变块大小计算。本文首先总结了可变块大小 FSBMA的SAD匹配准则的求和规律并分析了AB2、AS2和全树型三种典型结构在支持可变块大小计算上存在的不足。在此基础上,分别改进了AB2和AS2结构的SAD求和过程以及全树型结构的搜索区数据输入方式和SAD求和顺序,使三种改进后的结构可以同时计算 MPEG-4 AVC/H.264标准要求的7种块大小的SAD,并且在计算较大块的SAD时,可以充分利用较小块 SAD的部分和。其中,改进的AB2和AS2结构保持原结构的搜索区数据流和处理能力不变;改进的全树型结构尽管为了减少输入数据宽度而相对原结构在性能上有所下降,但仍可获得同 AB2结构相同的处理能力。  上述改进的AB2和全树型结构相对AS2在硬件规模上优势明显,但是由于存在大量的无效计算致使 PE利用率仅为70%,处理能力远低于 AS2,难以满足高性能实时编码要求。无效计算是由于结构中所采用的搜索区单方向扫描方式因换行(或列)而引起的。因此,为了提高 PE利用率,本文提出了可以消除无效计算的、具有三种方向的搜索区扫描方式。在改进全树型结构的基础上,提出了支持上述扫描方式的动态可重构运算阵列结构,在计算过程中可以获得100%的PE利用率。针对搜索区数据流的特点,设计了一种可扩展的可重构存储结构。该结构采用多存储体结合可重构的crossbar接口及串并转换移位寄存器,可以向运算阵列并行输出上述扫描方式中三种方向的数据流。通过增减存储体的容量可以实现在外存访问带宽和搜索区数据利用率之间折中的缓存方案。采用TSMC0.18um CMOS工艺库实现了上述可重构结构的电路。电路工作在180MHz的频率下,可实时处理分辨率为1280×720的、45fps的视频序列。  最后,本文对支持多种BMA的可重构结构进行了深入研究,目的是在功耗受限应用中通过选择不同的BMA来获得视频质量、计算复杂度和功耗之间的多种折中。文中,首先基于 BMA在计算复杂度和功耗方面划分的三个级别,提出了设计目标和结构的总体规划。在此基础上,详细讨论了可重构结构中的三个核心部分:可重构运算阵列(RCA)、可重构存储结构和可重构地址产生单元。其中,RCA通过配置可以支持具有高、中、低三种计算复杂度的算法;可重构存储结构通过可重构参考块存储阵列、可重构候选块寄存器阵列和搜索区数据存储器等三部分结构来实现不同算法要求的参考块、候选块和搜索区的数据流;可重构地址产生单元是在总结块匹配算法的地址产生规律的基础上提出的一种基于 LUT的灵活结构,可以实现多种算法的地址产生。我们采用TSMC0.18um CMOS工艺库,电路实现不同计算复杂度的算法时,平均功耗在7.3~247mW之间变化。
其他文献
[创作理念]rn沉迷网络游戏的青少年往往难以自拔,又不知所措.他们在现实世界受挫,在网络世界重新找回存在感、成就感,满足了内心的需要.所以,当现实更加不堪时,这些孩子会想,
二氧化氮(NO2)是一种存在于大气中的典型污染物,不仅可导致光化学烟雾与酸雨危害环境,而且更是导致PM2.5大气污染物形成的元凶之一,对人类健康产生显著威胁。因此研发可以快速
随着隐身技术、电子干扰、反辐射导弹等雷达对抗技术的发展,以雷达为代表的有源定位系统的应用遇到越来越多的困难。无源定位系统由于自身不发射电磁波,隐蔽性好,作用距离远,
本论文的设计工作来源于西安电子科技大学的科研项目“电源管理类集成电路关键技术理论研究与设计”,作者承担了一款输出可动态编程高效电流模同步降压型DC/DC转换器的设计工作。论文在深入系统地分析和研究了电流模降压型DC/DC转换器的工作原理和关键技术的基础上,针对第三代WCDMA手机射频功率放大器电源管理的特点,成功地设计了一款输出可动态编程的高效电流模同步降压型DC/DC转换器芯片XD1909。该芯
自然杀伤细胞细胞(NK)是天然免疫系统中重要的免疫细胞,可以直接杀伤某些肿瘤和病毒感染的靶细胞。NK细胞上分布着多种重要的受体分子,例如KIR、CD94/NKG2、NKP等,这些分子通
蛋白激酶是重要的药物靶点之一。激酶催化域中保守基序Asp-Phe-Gly(DFG)的构象控制着其活性状态:DFG-in构象对应活性状态,而DFG-out构象为非活性状态。与靶向DFG-in构象的type
2008年1月中旬至2月初,发生在我国南方的特大冰雪灾害对亚热带常绿阔叶林造成了巨大的破坏。为了解古田山24 ha固定监测样地在此次雪灾中的受损情况,我们调查了样地中所有胸
电力线通信是指以电力线为传输媒介进行数据传送和信息交换.随着调制技术、传输技术和信号处理技术的进步,电力线通信技术近年来飞速发展。由于电力线通信具有不需要重新布线,成本低廉等优点,在通信各领域受到了极大的关注。正交频分复用技术(OFDM)是实现电力线通信的关键技术。它利用多个相互正交的子载波来传送信息,不但大大提高了频谱利用率,同时也有效克服了电力线信道中的频率选择性衰落和多径时延,是实现可靠通信
压缩感知是一种新型的编码技术,该技术在信号采样的同时进行压缩,大大降低了采样率,突破了奈奎斯特采样定理中采样率必须大于等于两倍信号最高频率的局限性。压缩感知具有低
用半导体光电导开关(Photoconductive Semiconductor Switches,简称PCSS’s)产生的超短电磁脉冲可应用于雷达、通信、THZ成像等技术领域。与传统开关相比,PCSS’s具有开关速度快、触发无晃动、寄生电感电容小、高重复频率、结构简单紧凑等特点。在触发光脉冲一定的情况下,半导体光电导开关中的载流子在开关里面的输运情况从根本上决定了所输出的电脉冲的波形,而影响载流子