基于ROI和JND的3D视频编码研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:dalang003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
3D视频在带给人身临其境的视觉体验的同时,也因其庞大的数据量而给视频的存储和传输带来了巨大的压力。因此,如何在保证视频主观质量的前提下,尽可能占用更小的传输带宽是3D视频编码领域亟待解决的重大挑战。以往的编码算法主要集中精力于去除视频的空间冗余、时间冗余等,而我们将注意力转向于去除视频中的视觉冗余。为此,本文提出把人眼视觉特性与现有的H.264编码框架相结合,着力于利用3D视频中的感兴趣区域和恰可察觉失真,在保证主观质量的前提下,尽可能减少码率,最终提高压缩效率。感兴趣区域(Region Of Interest,ROI)编码是指通过控制视频背景区域与ROI区域的宏块量化参数(Quantization Parameter,QP)的分配,在保证视频主观质量的同时提高压缩效率。对2D视频而言,ROI检测性能不稳定,这限制了 ROI编码的推广与使用。而3D视频中包含的深度信息与人类视觉模型(HVS)中感兴趣程度间有着十分密切的联系,这为3D视频ROI区域检测提供了有利条件。因此本文综合深度信息,提出了两种3D显著性检测算法。恰可察觉失真(Just Noticeable Distortion,JND)是指由人类视觉系统的生理特性和心理特性所造成的,对图像不同区域具有不同失真敏感度的现象。当图像特定区域的失真程度低于JND阈值时,人眼无法感知其存在。JND视频编码技术主要针对视频的视觉冗余,在编码时结合人眼视觉特性,合理分配编码资源,进一步提高编码的效率。本文主要利用3D视频(单视点视频加深度图格式)中的纹理和深度信息,对其进行与H.264标准兼容的ROI和JND编码的研究。本文首先研究了人眼立体视觉系统模型,分析了景物深度与HVS中感兴趣程度间的关系。由此,提出了基于深度的立体投影显著性检测算法;进一步发掘深度和场景中背景区域的关系,提出了基于背景检测的3D显著性检测算法。针对人眼对不同深度的注意程度不同,以及不同视点间物体的相互遮盖等关系,提出了一种利用深度图计算JND阈值的模型。之后,探讨了 H.264压缩标准和压缩后比特率的构成和调整方式。据此,在视频进行H.264压缩前,通过结合ROI和JND对视频帧的区域划分,建立更加符合人眼视觉特性的分级量化模型,指导人眼感兴趣区域量化参数的选取,进一步提升ROI区域的主观质量并提高编码效率。最后,从理论和实验两方面,分析了这个分级量化策略对视频压缩后比特率的影响。实验结果表明本文的方案在同等码率下,以较低失真保存了人眼视觉敏感区域,为用户提供了较好的视觉体验。
其他文献
学位
逆合成孔径成像激光雷达(InverseSyntheticApertureImagingLidar,ISAIL)是逆合成孔径技术与相干激光雷达的结合,以激光作为发射信号,使用大带宽激光信号和虚拟的合成孔径来实现
随着人们环保意识的逐渐加强,对环境监测的要求也越来越高,面向不同测量领域的分布式在线环境监测系统不断投入实际应用,但是,目前我国的环境监测数据传输还主要通过有线网络
学位
LTE-A(Long Term Evolution-Advanced)是3GPP组织为满足下一代无线通信技术4G而提出的LTE增强方案,是近年来的研究热点。在LTE-A系统中,数据相干检测、信道质量检测、软译码等
为了提高系统容量,研究人员在可见光通信(VLC)中引入了多输入多输出(MIMO)技术。但是,MIMO技术在提高信道容量的同时,也带来了信道间干扰,使得MIMOVLC系统的性能严重恶化。信
随着智能移动终端的普及和流行,移动数据流量正以前所未有的速率急剧增加。蜂窝网络被迫从过去以连接为主的端到端通信向以内容为中心的未来通信转变,面临着资源短缺,容量受
近年来,空气污染日益严重,提升空气质量是民众的迫切期盼,因此空气质量监测系统的建设也成为各地环境保护局和众多环境保护企业所关注的焦点领域。建设空气质量监测系统首先