基于HEVC的快速运动估计技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:chenglin229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体技术和互联网的高速发展促使图像视频信息爆炸式增长。随着多媒体处理技术的不断发展,视频技术正朝着超高清和立体的方向发展。在过去的二三十年间,视频编码技术得到了广泛的应用和迅猛的发展。高效视频编码技术H.265/HEVC(High Efficiency Video Coding)是ITU-T VCEG和ISO/IEC MPEG联合推出的最新视频编码标准。HEVC为了获得更高的编码性能,使用了更为复杂的编码技术,同时编码复杂度也大大增加。运动估计是视频编码器中的一个关键的组成部分,用以去除视频的时间冗余,它在编码过程中大概占据了一半的时间复杂度。因此,如何找到一种既快速又高效的运动估计方法是视频编码领域的一个核心问题。  本文对HEVC的运动估计过程进行了研究。HEVC编码器中,运动估计包括整数像素和分数像素两个阶段。本文分别提出了基于运动特征的整数像素自适应运动估计算法和基于纹理方向的快速分数像素运动估计算法,在基本不降低编码效率的条件下降低了编码复杂度。  第一,本文提出了基于运动特征的整数像素自适应运动估计算法。首先,同属一个运动区域的相邻块具有很强的运动相关性,该方法通过检测当前块与它的相邻块是否是运动一致区域,确定搜索窗口内的有效搜索方向和范围,减少需要计算的匹配点数量;其次,该方法通过预测当前块的运动强度采用不同的搜索方法进行搜索。根据空域相邻块的运动相关性,当前块的运动强度大小可通过已编码的相邻块的运动信息来预测得到。确定运动强度后,剧烈运动采用HEVC的运动估计方法,平缓运动使用速度更快的基于六边形模板的搜索方法。上述方法的结合可以有效地减少无效搜索点的数量,从而降低了编码复杂度。  第二,为了加快HEVC分数像素运动估计的速度,本文提出了基于纹理方向的快速分数像素运动估计算法。首先,我们提出了一种选择性地跳过分数像素运动估计的方法。最终的运动矢量(Motion Vector,MV)是整数像素MV的块在所有块中占有很大比例,分数像素搜索对它们编码性能的提升并不明显。该方法采用整数像素MV对应的平均绝对误差来确定是否跳过分数像素运动搜索;其次,针对一些插值操作在物体纹理方向上产生模糊效应并增加运动估计运算量的情况,我们提出了基于纹理方向的快速算法。对于不同的纹理方向,该算法采用不同的插值和搜索方式,进一步减少分数像素运动估计的运算量。这样,在不影响编码效率的前提下,本算法的运动估计模块的时间比HEVC平均减少了40.86%。
其他文献
近年来随着各种重大Web安全事件的发生,对Web安全攻防技术的研究也越来越受到重视,被广泛研究的Web安全技术之一是Web渗透测试。Web渗透测试技术是从攻击者的角度考虑目标Web环
射频识别(RFID)技术作为一项无线自动识别技术在各种相关的行业中逐步被人们所认识和重视。但由于部分尚存的问题困难,致使超高频系统的应用还不是很广,针对存在的问题,需经系统
综合信息系统中分系统越来越多,而且日益复杂。各个分系统之间数据交互的要求也不断增加,同时各种历史数据爆炸性增加。实现综合信息系统中的数据实时、高效地分发,以及各个分系
篇章关系是文本中的组成部分彼此之间的语义关系,篇章语义关系分析是自然语言处理中的一个基本任务,很多其他任务都能从中受益。本文对篇章关系的关键技术进行了研究,对篇章关系
众包是互联网环境下一种新兴的分布式解决问题的生产方式。众包模式可帮助企业获得全球化的人力资源,显著降低开发成本,提高生产效率。采用众包模式开发软件是未来软件发展的一
随着人类对于软件的使用越来越广泛普遍,研究越来越深入,对其精确度的要求也越来越高。程序的语法错误可以在相应的平台上完成检测,但是并没有完成程序逻辑检测。针对软件逻辑错
信息技术的进步和计算机软硬件技术的快速发展推动了计算机系统的大量普及。启动速度是衡量计算机系统性能和用户体验的重要指标之一。提升计算机系统启动速度具有重要意义。
矩阵是一种非常重要的基本数据结构,它在电子商务、社会网络、信息检索等领域都有广泛的应用。如今这些领域处理的数据量越来越大,而过去对矩阵运算的研究多集中在单机算法,用户
自动文本摘要通过计算机技术完成对文本的分析,并能够自动生成摘要以及实现对内容的总结,能够帮助用户尽快获取可用信息,并有利于用户对自身兴趣的定位。对自动文本摘要的研究,在
随着计算机计算能力的迅猛发展,计算机所能处理问题的规模越来越大,提高计算的可信性和高效性已成为工业界和科学界的共同目标.符号计算可以得到问题的精确结果,但计算复杂度高;