视频压缩中若干关键技术的研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:xiaopirate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据压缩技术是多媒体领域的重要研究方向之一。由于多媒体数据量非常巨大,海量多媒体数据的存储和传输成为多媒体应用所面临的主要问题。通过使用数据压缩技术,对多媒体数据进行压缩,可以有效的减少多媒体数据量,在现有的设备条件下实现多媒体数据的有效存储和传输,使多媒体应用成为可能。视频数据在多媒体数据中所占比例最为显著,因此视频压缩效率的高低对多媒体数据压缩的影响也最大。视频压缩技术经过长期的发展,压缩算法被不断地改进,压缩性能逐步提高,各种视频压缩技术相关的产品已被广泛的使用。目前,视频压缩技术已经被标准化,国内外出现了很多视频压缩标准,其中主要有MPEG-2,H.264/AVC和AVS等。尽管视频压缩技术已经发展很长时间,但并不完善,在很多地方还存在着问题,其中一些问题长期困扰着视频压缩研究者和开发者们,不解决这些问题,将直接影响到新理论和新技术的应用,阻碍视频压缩技术的发展,因此,解决这些问题已经成为本领域的重要任务。本文的部分研究内容就是围绕着视频压缩技术中存在的若干问题,重点放在离散余弦变换技术上,通过对离散余弦变换技术的深入研究,着重解决离散余弦变换相关技术在视频压缩中存在的高复杂度问题和离散余弦变换定点化导致解码器误差漂移的问题。另外,为了满足视频压缩发展对多标准技术的迫切需要,本文也对MPEG的多标准描述技术框架可重构视频编码做了系统的研究,在可重构编码技术框架下重构出AVS解码器,并实现了AVS的解码工具与MPEG的解码工具的混合重构。本文主要的研究内容如下:   首先,针对H.264/AVC编解码器的离散余弦变换相关技术自适应块变换编码模式在取得高压缩效率的同时也有很高复杂度的问题,在自适应块变换模式中引入了扩展变换的概念,在H.264/AVC原有4×4整数变换基础上,利用扩展变换关系,推导出一个新的8×8整数变换。在自适应块变换模式下,新的8×8整数变换替换H.264/AVC原有的8×8整数变换,与原来的4×4整数变换一起共同使用一个8×8的量化表,节省了更多的存储开销。另外,新的8×8整数变换比原来的8×8整数变换更简单,计算复杂度更低。实验结果表明基于扩展8×8/4×4整数变换的自适应块变换模式在保持了自适应块变换模式的高压缩效率同时,也降低了空间和时间复杂度。   其次,针对浮点离散余弦变换的整数近似实现会导致解码器产生误差漂移的问题,提出了一套具有非常高精度的整数离散余弦反变换,该整数离散余弦反变换通过公因子提取和两阶段缩放算法得到具有和浮点离散余弦反变换非常相近的计算精度,在解码器中使用提出的整数离散余弦反变换代替浮点离散余弦反变换,能够避免通常整数离散余弦反变换导致的解码图像误差漂移问题。在极端的测试条件下,与视频编码标准推荐的整数反变换相比,图像的误差漂移显著降低。提出的整数反变换的变换核采用无乘操作,大大降低了反变换的计算复杂度。   最后,为了实现包括AVS在内的多个视频标准压缩码流的解码,并且支持不同标准解码工具的相互连接,重构出新的解码器,使解码器不仅可以解码单一标准的压缩码流也可以解码不同标准的编码工具组合在一起压缩出来的码流,我们在MPEG的多标准描述技术框架中,描述了AVS的语法结构,添加了AVS的解码工具,重构出AVS解码器,使AVS码流能够被MPEG的多标准解码器解码,实现了MPEG多标准技术框架对AVS标准的支持。另外,还将AVS的整数反变换和反量化替换了MPEG-4标准的相应解码工具,重构出新的解码器。通过这种灵活的重构方式可以发挥不同标准解码工具的优势,使新的工具组合能够有更高的编码性能或更低的编码复杂度。   总之,本文重点围绕离散余弦变换在视频压缩中存在的若干问题以及在MPEG多标准技术框架下AVS解码工具描述的技术问题进行探索和研究,提出了对这些关键技术的改进方法或者解决方案,本文所提出的部分技术方法已经被采纳进推荐的国际标准,在实际中得到应用。
其他文献
随着计算机和互联网技术的迅速发展和逐渐普及,数字图书馆作为一种重要的知识共享平台受到了越来越多的关注,不仅在商业领域受到了产业界的重视,而且在学术领域同样具有研究价值
本文主要研究基于点特征的图像匹配算法。点特征是图像上具有明显特性并能够把目标标识出来的点,它可以较好的描述目标的特征。点特征检测和图像匹配技术在计算机视觉和图像理
片上多处理器(CMP)是当前主流的微处理器体系结构,它利用现有的海量晶体管资源在单个芯片上集成多个处理器核,通过多核并行执行的方式开发指令级和线程级等各个层面的并行度来
当计算机网络应用的日益普及,伴随而来的是一系列的网络安全问题,入侵检测技术作为一种主动的信息安全保障措施,备受关注。 本文首先以网络安全为基础,介绍了入侵检测的概念、
Petri网提供了一种以图形和数学为基础的形式化建模方法。现在它已经成为建模和分析工业系统的成熟工具,其应用领域也越来越广泛,涉及到工作流管理,软件工程,并发程序设计,异步电
P2P是由若干互相对等的网络结点组成的一种网络结构,其中每个网络节点称为对等点,对等点消除了服务器和客户端间的角色差别,通过它们之间的信息直接交换完成计算和信息的共享.JX
压缩感知理论是近几年兴起来的一门新的信号采样理论,它打破了传统信号采样理论在采样频率方面的限制,引起了学术界的巨大轰动。传统信号采样理论包含了四个方面的内容:采样、
随着国际化交流日益频繁,多语人才的需求越来越迫切,口语测试的普及率、公平性受到广泛关注。面对传统的口语测试所带来的时空受限、组织成本高、评估主观性强、反馈信息单一等
本文是基于机器学习中的局部加权学习(Locally Weighted Learning,简称LWL)进行了深入的研究,这种学习方法既可用于回归问题(局部加权线性回归),又可用于分类问题(局部加权朴素
在传统的客户机/服务器(Client/Server,C/S)体系架构的企业应用系统开发中,数据一般存放在服务器上,应用程序一般存放在客户端计算机上。这样的系统虽然解决了数据共享等问题,但