论文部分内容阅读
隔行视频(Interlaced Video)信号在电视广播领域内得到广泛应用.然而,随着计算机和多媒体技术的发展,逐行视频(Progressive Video)在互联网上应用非常普及.在电视广播、通信和计算机网络应用相互渗透的多网融合的环境下,隔行视频和逐行视频同时被使用.扫描方式的不同导致采集和显示设备之间的异构,这种异构会引起兼容问题.另外,新的视频编码标准要在多网融合环境下推广,必须支持隔行视频编码.总之,多网融合环境下存在许多与隔行视频相关的问题有待研究,例如:逐行视频设备如何显示隔行视频的内容?如何同时为隔行视频用户和逐行视频用户提供各自需要的服务?如何提高新的视频编码标准对隔行视频编码的速度?针对这些问题,本论文主要研究了隔行视频到逐行视频的格式转换技术、隔行视频到逐行视频的可伸缩视频编码技术,以及适用于隔行视频编码的快速自适应帧场编码技术.主要的研究成果包括:
1.提出基于精确运动检测和混叠补偿插值滤波的自适应去隔行算法.
结合数字信号处理和视频处理的理论基础,提出了基于精确运动检测和混叠补偿插值的运动自适应去隔行算法.运动检测是运动自适应的去隔行算法的关键技术.运动检测时可能存在两种错误,即过检测或者欠检测.过检测是指把静止区域错误判断为运动区域,然后用场内插值方法去隔行,不能有效提高分辨率.而欠检测是指把运动区域错误检测为静止区域,然后采用场间插值方法去隔行,造成恢复图像的严重锯齿效应.本文提出的精确运动检测算法通过中值滤波的五场运动检测,有效提高运动检测精度.另外,针对场图像隔行取样造成频谱混叠问题,基于维纳滤波原理提出了混叠补偿插值滤波器.该滤波器能有效抑制混叠,并能保持图像的边缘.结合以上两种算法,本论文提出的运动自适应去隔行算法恢复的逐行视频比一般的方法在主观和客观质量上都有明显改进.
2.提出了基于中频优先的系数扫描顺序及自适应层间纹理预测的隔行/逐行可伸缩视频编码方法.
层间纹理预测是可伸缩视频编码的基本工具.为了提高增强层的编码效率,本文研究了如何提高层间纹理预测残差熵编码效率和改善层间预测精度.本文从理论上说明了隔行/逐行层间纹理预测残差不是平稳随机场.通过统计分析残差变换系数的分布特点,发现层间纹理预测残差系数的竖直方向上中频能量较大,因此本文提出新的系数扫描顺序,称为基于中频优先的系数扫描顺序.在不改变语法结构的条件下,中频优先的层间纹理预测残差系数扫描机制提高了增强层系数的熵编码效率.另外,现有的可伸缩编码中层间纹理预测仅采用了场内插值方式.根据自适应去隔行算法的研究成果,运动纹理活性不同的区域采用不同的预测模式更有利于提高预测精度.因此,本文提出了宏块自适应层间纹理预测机制.此时,增强层宏块动态选择场内插值模式或者场间插值模式进行层间纹理预测,从而改善了层间纹理预测精度,提高了增强层的编码效率.
3.提出了基于运动检测的快速自适应帧场编码算法.
为提高隔行视频的编码效率,H.264/AVC视频编码标准提供了图像级自适应帧场编码 (Picture Adaptive Frame/Field,PAFF)和宏块级自适应帧场编码(Macroblock Adaptive Frame/Field,MBAFF).采用基于率失真优化技术的PAFF与MBAFF组合编码模式能对隔行视频取得最佳编码性能,但是需要三遍编码,计算复杂度太大.本文统计分析了自适应帧场编码模式与视频运动特性的关系,并且研究了帧场编码模式对率失真性能的影响.在此基础之上,本文提出了基于运动检测快速自适应帧场编码算法,此快速算法只需要进行一遍编码.根据宏块对的纹理与运动活性判决宏块对的帧场模式,并在宏块对帧场模式判决结果的基础上判决图像级帧场模式.在编码性能没有明显下降的条件下,采用基于运动检测的快速自适应帧场编码只需要率失真优化方法的三分之一计算时间.