视频编码率失真优化技术及其应用研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:weihan0533
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为视觉信息的载体,图像视频数据呈现出高分辨率、高维度的发展趋势,使得人们能够获得更加优质的视觉体验。尤其是近期人工智能的飞速发展,人们对智能化生活的需求日益迫切,以数据驱动的多媒体应用必然造成图像视频数据的爆炸式增长,进而带来巨大的数据存储压力和传输带宽需求,极大阻碍了多媒体应用的发展。为了满足多媒体应用的需求,国际标准组织先后发展了多代图像视频编码标准,不断提升图像视频的压缩效率。然而,随着高清、超高清视频及具有沉浸感的三维视频的普及,视频编码效率仍有待进一步提高。
  为了提升编码效率,大多视频编码技术以增加编码复杂度为代价,极大地降低了视频编码器的实用性。另外,现有视频编码工具大都针对传统图像视频数据格式设计,对于数据格式迥异的图像视频往往无法高效压缩。尤其是近年来逐渐兴起的光场图像数据,现有编码工具已无法取得良好的编码性能。最后,为了达到较高的压缩效率,视频压缩大都采用有损压缩的方式,从而造成不可恢复的压缩失真,对以内容分析为主体的多媒体应用造成难以预计的影响。
  本文从率失真优化及其应用的角度出发,开展视频编码优化方面的研究工作,主要创新及贡献如下:
  1.在视频编码变换过程中,可通过增加变换核数量的方式提升编码效率,但编码时间复杂度也随之增高。为了取得编码性能和编码时间复杂度之间更好的平衡,本文分析了最新发展的帧内预测方法,充分考虑了相邻帧内角度预测模式的夹角较小这一特点,从率失真优化角度阐述了帧内预测模式判决、变换核数量和编码时间复杂度三者的关系,提出了对偶互换机制,使得相邻帧内预测模式采用不同的水平和垂直变换核;根据帧内预测残差分布及变换核选择的统计实验结果设计了帧内预测模式依赖变换核查找表,结合对偶互换机制,提出了相邻帧内预测模式的变换核选择方法。实验结果表明,与视频编码参考软件JEM-7.0相比,虽然最新发展的自适应多核变换方法在亮度和色度分量上可分别取得3.38%、0.69%和0.75%的BD-rate节省,但编码时间增加了78%;本文所提算法在亮度分量和色度分量上可取得2.15%、2.55%和2.60%的BD-rate节省,在4K视频序列上,本文算法在亮度分量和色度分量上最高可取得3.97%、3.75%和4.59%的BD-rate节省,平均编码时间仅增加6%,能够在编码效率和编码时间复杂度之间取得更好的平衡。
  2.为了提升光场图像的压缩效率,本文采用基于伪视频序列的光场图像压缩框架,首先将光场图像转化为多幅子视点图像,然后将子视点图像按照一定的视点扫描顺序生成伪视频序列,最后利用现有视频编码器对伪视频序列进行压缩。在基于伪视频序列的光场图像压缩框架下,伪视频序列中编码帧的排序对编码性能起着至关重要的作用。本文充分考虑了编码过程中编码帧之间的时域依赖性,从视差和视点间的质量差异两点因素出发,提出了新的视点扫描方式,使得生成的伪视频序列中相邻帧之间具有更强的相关性。实验结果表明,与之字形排序方式相比,本文所提算法平均可达16.4%的BD-rate节省。为了进一步提升编码性能,将时域依赖率失真优化方法引入到编码过程中,同时提出了I帧的QP调节策略。实验结果表明,与之字形排序方式相比,改进算法平均可达21.8%的BD-rate节省。
  3.视频压缩失真会对目标检测性能造成影响,使得编码前后视频的检测结果不一致。本文首先将编码前后视频的检测差异定义为分析失真,然后将分析失真引入到编码的率失真优化过程中,使得在有限带宽限制下压缩失真和分析失真最小。获取分析失真需要反复多次编码并运行目标检测算法,为了避免该过程,本文提出了基于二次编码的优化方法,采用二次编码获得压缩失真,然后构建线性模型利用压缩失真对分析失真进行预测;通过大量统计实验拟合了分析失真和码率之间的函数关系,构建了率失准模型;最终通过求解拉格朗日乘子实现码率、压缩失真和分析失真的联合优化,有效降低了视频编码造成的分析失真。为了进一步降低编码时间复杂度,本文提出了基于一次编码的改进算法,利用时域层级间参考关系对高时域层的压缩失真进行预测,降低了编码时间。实验结果表明,与视频编码标准HEVC(High Efficient Video Coding)相比,本文所提的两种算法最高可降低40%的分析失真。
其他文献
近年来,重金属镉(Cadmium)污染的问题日益严峻,而传统的检测手段存在着检测仪器昂贵、操作程序复杂的缺点。本课题建立了电化学蒸气生成体系(EcHG)和原子荧光光谱法联用测定镉含量的方法。该(EcHG)系统由两个串接的石墨管作为两个电极、一个恒压模式的交直流电源适配器作为电源以及玻璃料孔气泡分离器(GLS)作为气液分离装置所构成。在室温条件下通过电解酸化的样品溶液,使镉元素在溶液中形成挥发性的氢
学位
铜(Cu)是植物必需的微量元素,作为多种酶的辅因子参与植物的许多生理生化反应。Cu缺乏和Cu过量均会影响植物正常的生长发育,因此植物进化出精妙复杂的调控网络来严格控制植物体内的Cu含量。植物Cu转运蛋白COPT(copper transporter)家族成员具有三个跨膜结构域,其中包含有多个能够与金属离子结合的氨基酸,被认为在COPT的Cu吸收和转运中发挥重要作用。COPT1、COPT2和COPT
学位
氨氮是生物体内正常代谢产物之一,也是维持生态平衡的重要营养元素。但随着工业和经济的快速发展,我国地表水体氨氮污染严重,对水生生物生存构成了严重威胁。氨氮致毒机理的研究多集中于脊椎动物,对水生无脊椎动物的致毒机理尚未见详细的报道。河蚬(Corbicula fluminea Müller,1774)在我国有悠久的养殖历史,具有优良的生产性能和较高的经济、药用价值。本研究以河蚬为实验动物,探究了氨氮对无
学位
大白菜(Brassica rapa L.ssp.pekinensis)作为人们经常食用的蔬菜,味美价廉,维生素含量丰富,有“菜中之王”的美称。随着人们广泛的种植,病害的发生愈加频繁,根肿病和干烧心病便是大白菜种植中常见的病害。根肿病是由芸薹根肿菌(Plasmodiophora brassicae Woron.)侵染引起的病害,被根肿病菌感染的土地,几年内不再适宜十字花科类蔬菜的种植,病菌难以彻底杀
学位
烟粉虱是唯一被冠名“超级害虫”的昆虫,入侵到全球很多国家,至少由36个隐种组成。其中的MEAM1隐种(B型)和MED隐种(Q型)是入侵性最强、危害最大的两个隐种。近十年来,MED烟粉虱因抗药性、传毒能力等方面的优势,逐渐取代了MEAM1烟粉虱成为当前我国的主要隐种。烟粉虱不但直接为害植株,更主要还传播番茄黄化曲叶病毒(Tomato yellow leaf curl virus,TYLCV)病严重威
学位
本文主要研究丁酸梭菌(Clostridium butyricum,CB)缓解产肠毒素大肠杆菌K88(Enterotoxigenic Escherichia coli K88,ETEC K88)和猪霍乱沙门氏菌(Salmonella choleraesuis,SC)造成的猪肠上皮细胞损伤的分子机制。试验由三部分组成:  试验一:(1)试验从健康断奶仔猪的粪便中利用常规方法分离得到相似菌落并进行纯培养
学位
我国农田重金属污染严重,尤其以Cd和As最为严重。重金属低积累种类或品种替代种植是解决污染农田安全利用的一项重要措施。目前,关于水稻、小麦、玉米、马铃薯等主粮作物和蔬菜对重金属的富集特性已进行了大量研究,我国是食用豆生产大国,而对食用豆的相关研究较少。这严重制约了食用豆作为替代作物种类在受污染耕地安全利用中的应用和推广。为此,本研究选取了绿豆、红豆、芸豆、蚕豆和豌豆等五大类食用豆,共119个品种,
学位
目的:Bcr-Abl融合蛋白是慢性髓细胞白血病(Chronic myeloid leukemia,CML)的致病根源,其定位于细胞质中,而Bcr-Abl的核定位可以诱导CML细胞发生凋亡。本课题组在前期Bcr-Abl蛋白亚细胞定位研究中发现,Bcr-AblCC结构域直接影响Bcr-Abl的定位及功能。考虑到蛋白间的相互作用会影响其亚细胞定位,我们推测胞质中存在某种蛋白通过与CC结构域互作使Bcr-
该文在热重分析方法的基础上,提出采用CO气体释放法(EGA-CO)对煤的燃烧特性进行了研究,这种方法比TGA法简单,成本低廉,渴望在燃煤电厂普遍使用,指导生产.在以上试验和理论的基础上,该文设计了CO气体释放分析仪,对不同种类的煤、混煤以及掺煤污泥进行了燃烧特性分析,得出以下结论:1.对单煤种的CO气体释放分析实验表明,可用于棵出煤的着火点、燃尽点和其它的特征点的测量和判断.2.对混煤及煤与污泥混
地震反演成像技术能够通过采集的地震记录和测井数据得到地下的地质结构信息和岩石属性信息,是地球物理勘探和储层预测的核心技术。随着油气勘探从结构简单的浅层向结构复杂的深层地质构造转移,常规地震反演方法的效率和精度已经无法满足油气勘探开发生产实际的需求,因此,深入开展地震反演方法研究,降低反演多解性,提高反演精度和效率,具有十分重要的理论意义和工程应用价值。  为了进一步提高地震反演成像技术的精度及运算
学位