H.264快速运动估计算法研究与实现

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:zn19861225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最新的国际视频编码标准H.264是由ITU-T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)组成的联合视频组(Joint Video Team, JVT)在2003年提出的。因为H.264采用了许多新的技术,如:可变块大小的运动估计(variable block size motion estimation)、小数像素的运动估计(decimal pixel resolution motion estimation)、多参考帧的运动估计(multi-reference frame motion estimation)、率失真优化(rate distortion optimization, RDO)、CABAC(context-based adaptive binary arithmetic coding)、CAVLC(context-adaptive variable length coding)等,H.264的编码效率要优于以前的视频编码标准。然而也因为采用了这些技术,使得H.264的运动估计部分的计算复杂度大大高于以前的编码标准。正因为如此,降低H.264中运动估计复杂度的算法的研究是近年来国际上的研究热点。在充分考虑了各种图像序列的运动特性的基础上,我们提出了基于矢量预测和多方向梯度下降搜索算法(Multi-Direction Gradient Descent Search,MDGDS)算法。该算法首先利用运动矢量的时间和空间上的相关性来得到预测矢量的搜索起始点,再通过使用自适应阈值来判断当前块的运动类型,以此来采用不同的搜索策略。这个算法可以快速扩展搜索范围和提高运动估计的搜索速度,从而避免使搜索过程陷入局部极小。实验结果表明,与非对称十字多级六边形搜索算法(UMHexagonS)、简化的非对称十字多级六边形搜索算法(简化UMHS)以及增强预测区域搜索法(EPZS)等传统算法相比,本算法能在保持运动估计精度的同时进一步地节约大量的编码时间。在通过对多个QCIF视频序列的编码结果的统计分析的基础上,我们发现以下三个特征:每种模式被采用的概率不均匀;相邻宏块的模式与当前宏块的模式存在着比较大的相关性;上层模式和下层模式之间存在一定的相关性。同时,由于模式的分布并不均匀,在某些情况下,我们可以忽略一些对编码效率的影响很有限和出现几率很小的模式。基于上述发现,我们提出了一种基于统计特征的适于H.264的快速模式选择算法。该算法利用编码模式的上述统计特征来提前终止运动估计中模式的搜索过程,从而减少运算量和提高编码效率。实验结果表明,与高复杂模式(High complexity mode, HCM)算法、以及快速高复杂模式选择(Fast high complexity mode, FHCM)算法相比,所提出的算法能在保持几乎相同的率失真性能的同时进一步地节约大量的编码时间。本文的结构如下:首先介绍了H.264视频编码的原理,其中着重描述了H.264中的运动估计的原理和关键技术。接下来,详细描述了JM15.1(H.264的参考软件包)中的整数像素快速运动估计算法和快速模式选择算法。然后,重点阐述了我们所提出的一种新的整数像素快速运动估计算法和一种新的快速模式选择算法。
其他文献
随着计算机软件技术的发展,软件产品的应用功能和系统结构日趋庞大和复杂,软件测试过程中产生的运行剖面越来越多,这给计算机软件开发后期的软件可靠性测试工作带来巨大的挑
学位
教学管理工作是学校办学的重要工作之一,随着计算机技术和网络技术的发展,教学管理工作也从传统的手工处理解脱出来,采用现代化的办公自动化系统--教学管理系统来完成。教学
JXTA是用来解决P2P(Peer-to-Peer)对等计算的分布式网络计算平台,也是一个为P2P应用程序和服务提供标准协议的开放式资源项目。JXTA是juxtapose:并列)的缩写,这不仅说明网络中
钢结构节点设计是钢结构设计的重难点,采用传统的CAD(Computer Aided Design,计算机辅助设计)技术,很难灵活地进行钢结构节点设计。为此,将虚拟装配引入到钢结构节点设计中,
无线传感器网络是由部署在监测区域内大量的、廉价的、具有感知能力的微型传感器节点形成的一个多跳自组织网络。随着它的广泛应用和产业化实现,其安全问题日益突出。本文首
近年来词的分布式表示与组合模型在自然语言处理领域中取得了诸多突破性的成果。词的分布式表示使用实值向量对词进行建模,可以从无标记语料库学到词的语法和语义信息,而组合
在多标签分类问题中,每个样本同时对应多个标签构成的标签集合。多标签分类问题与传统的分类问题最主要的不同在于传统的分类是假设标签之间两两互斥,而多标签分类中标签之间
1993年,Aharonov提出了量子随机行走的概念,相比于经典随机行走,量子随机行走具有更快的扩散速度。2003年,第一个量子随机行走搜索算法,即SKW算法,从理论上证实了量子随机行
许多经典问题都用图结构来表示,图结构与关系数据相比有着更强的表达能力。网络模体的挖掘是研究复杂网络的重要分析手段,网络模体是指网络中频繁出现的互相连接的子结构,其
高光谱遥感图像是由二维空间信息和一维光谱信息组成的三维数据。同时具有地物目标的辐射、几何和光谱信息,能够从光谱空间中对地物予以细分和鉴别,在资源、环境、城市、生态等领域得到了广泛应用。受传感器的空间分辨率限制和自然界地物复杂多样性的影响,使得单个像元中往往包含多种地物覆盖类型(如:植被、河流、道路等),从而形成混合像元。混合像元的普遍存在不仅影响地物的识别和分类精度,而且是遥感技术向定量化发展的重