论文部分内容阅读
本论文对基于DCT的可伸缩视频编码进行了研究,主要包括以下内容:1.流媒体信源编码技术的研究近十几年来,数字视频编码技术不断发展成熟,新的技术能够以国际标准的形式迅速的应用于实际之中。科研向产业的有效转化使得国际上对于视频编码技术的研究始终保持活跃。近年来,随着宽带因特网的迅速普及,以及移动通信从2G向3G的过渡,视频业务由于网络和终端性能的提高也面临着爆炸性的发展。从用户的角度来说,通过网络观看视频有两种基本的方式:基于下载的和基于流的方式。当采用基于下载的方式时,用户需要先将完整的视频文件下载到本地存储,然后才能播放观看。这种方式需要等待的时间随着视频数据量的增加而增加,同时受到网络带宽的限制,并使得用户无法从一个视频流向另一个流方便的切换。而基于流的方式则是一边下载一边播放。因此,视频流系统成为了今天和未来的视频业务存储与发布的主要方式。本文首先介绍视频流系统的构成,对实现视频流系统的三种方式进行分析比较。然后分别详细讲述其中的转码和可伸缩视频编码技术的发展情况。2.基于H.264/AVC的可伸缩视频编码的研究随着H.264/AVC国际视频编码标准的逐渐成熟和推广,包括流媒体在内的越来越多的视频应用已经或即将采用H.264/AVC标准。而在迅速扩大的流媒体业务中,由于存在不同的网络和不同的终端,因此对于视频编码的可伸缩性方面的要求也越来越迫切。实现可伸缩视频编码既可以基于小波变换,也可基于DCT变换的编码结构。前者具有天然的嵌入式特性,更利于可伸缩性的实现。但是包括H.264/AVC在内的众多基于DCT的编码标准已经占领了广大的应用市场,因此基于DCT变换的可伸缩视频编码将更好的兼容现有标准,更利于推广应用。所以ISO的MPEG和ITU—T的VCEG,同意联合起来将SVC作为H.264/AVC的扩展集并由联合视频组(JVT)提出了草案。所谓的可伸缩视频编码技术要求视频编解码器在比特流级别具有以下可伸缩特性:通过简单的丢包或截断码流等操作提取出的子码流具有较低的空间一时间分辨率和/或较低的码率(对应于较低的视频质量),同时任何可能的子码流的编码效率应该与相应非可伸缩视频编解码器相当。可见,可伸缩性包含了时域、空域和质量(SNR)三个方面。本文重点研究了空域可伸缩性的实现。分析了空域可伸缩编码的分层结构和实现细节。提出了一种新的针对空域可伸缩编码层间预测的快速模式选择的方法,使得运算复杂度大大降低的同时,编码率失真性能只有轻微的降低3.H.264/AVC视频编码在DSP上的实现H.264/AVC虽然大大提高了压缩效率,但是与之相伴的是同样大幅提高的实现代价,包括更高的运算性能和更多的存储空间。这也造成了H.264/AVC走向实际应用的最大障碍。另一方面,在算法专用芯片尚未成熟的时候,具有可编程特性和丰富的多媒体功能的数字信号处理器(DSP),成为了在嵌入式终端上实现H.264/AVC算法的最佳平台。本文采用基于德州仪器(TI)公司的多媒体DSP——TMS320DM642的硬件平台,以国际H.264/AVC开源代码X264为参考软件,实现了H.264/AVC CIF格式的实时编码。