【摘 要】
:
随着高清与超高清视频的不断发展与普及,海量视频数据的存储和传输已经成为目前业界的巨大挑战。为了进一步降低视频流媒体的传输压力,VP9和HEVC等新一代视频编码标准随着发展应运而生。由于VP9格式开源且免费授权,其在流媒体行业中受到了更多的支持与推广。相较于其上一代编码标准VP8,由于引入了大量新技术,VP9能够提升接近一倍的编码性能。然而其编码复杂度也随着编码性能的改善而大幅提高,限制了VP9视频
论文部分内容阅读
随着高清与超高清视频的不断发展与普及,海量视频数据的存储和传输已经成为目前业界的巨大挑战。为了进一步降低视频流媒体的传输压力,VP9和HEVC等新一代视频编码标准随着发展应运而生。由于VP9格式开源且免费授权,其在流媒体行业中受到了更多的支持与推广。相较于其上一代编码标准VP8,由于引入了大量新技术,VP9能够提升接近一倍的编码性能。然而其编码复杂度也随着编码性能的改善而大幅提高,限制了VP9视频编码标准在实时通信场景下的应用。因此,如果在编码性能不变的前提下,减少编码复杂度成为目前实时音视频行业的一个迫切待解决的问题。因此,本文针对VP9编码器中耗费大量编码复杂度的超级块划分过程进行优化,基于不同的改进方向提出了两种快速算法。针对超级块划分时编码复杂度过高的问题,本文分析了VP9中超级块划分具有的特征,并建立了一个大型的数据集,其中包含了大量超级块划分的结果。通过对数据集进行统计分析,本文将超级块的四叉树划分过程抽象建模成一个三层的三分类模型,通过搭建分层的深度残差网络SHRN预测超级块各个深度的划分结构。编码器使用预测的超级块划分结构直接进行划分,可以跳过大量不必要的搜索过程,大大减少编码复杂度。实验结果表明,本文所提快速算法在编码性能基本不变的前提下平均降低帧内编码模式下超过60%的编码时间。针对现有快速算法没有考虑人类视觉系统的特性,本文提出基于视觉感知特性的超级块快速算法。本文首先对人类视觉系统的特性进行了系统的分析与总结,然后提出了基于亮度适应性、对比度掩蔽效应和视觉模式复杂度等视觉特性的多维JND感知阈值模型。根据该JND模型,可以计算出与超级块划分具有一致性的感知变化因子,用以对超级块的划分深度进行预处理,实现超级块划分的提前终止,减少了大量的编码复杂度。进一步地,通过将划分过程中的率失真优化过程替换为基于SHRN的快速算法,能够进一步减少编码复杂度。实验结果表明,本文所提基于视觉感知特性的超级块快速算法能够在编码性能基本保持不变的前提下减少超过70%的编码时间。
其他文献
随着国内二胎政策的开放,高龄孕妇的人数也逐步增加,相应地,孕妇和胎儿在围产期间的健康状况也越来越受到重视。因此,胎心监护作为临床上监护胎儿健康情况的常用手段,其准确性和实时性就非常重要。传统的胎心监护通常是靠医生人工判读,缺少统一性和实时性。近年来,随着医工交叉技术的成熟,基于计算机的辅助诊断技术已经被证明是一种有效的解决方式。故本文主要研究在计算机辅助条件下,对胎心监护中的相关指标进行自动分析诊
随着信息化社会的不断发展,越来越多的应用以大量数据处理为主要需求,对硬件平台的算力要求越来越高,传统的处理器由于基于冯·诺伊曼结构,在并行计算领域存在天然的局限性,无法提供强大的算力,因此可重构阵列重新成为了研究的热点。现有的可重构阵列大部分都仅应用于特定领域,对多领域下的应用缺乏足够的支持,此外,现有结构大多基于动态配置模式和单一的互连粒度,在复杂多变的应用领域中存在局限性。针对以上问题,本文研
面对日益突出的能源紧张和环境污染问题,电动汽车因其节能、环保和使用成本低等优点被视为是汽车产业未来的发展方向。然而,由于现有动力电池的能量密度远远低于汽油和柴油的能量密度,导致电动汽车的续航里程短。而且在电动汽车中,电池的研发和制造成本约占整车成本的40%左右,而使用寿命通常只有3到5年。因此,研究提升电动汽车能效和延长电池寿命对于电动汽车的发展至关重要。本文基于V2X通信技术,从降低能耗和延长电
浦东国际机场三期扩建工程主要包括卫星厅、T1捷运站、T2捷运站、VVIP贵宾楼、能源中心工程等建设以及扩建工程的网络通信系统与原T1/T2航站楼的网络通信系统的互联互通。在项目实施的过程中,需保障原T1/T2航站楼的正常生产运行,还要做到扩建工程的不间断施工。由于卫星厅建筑面积大,楼层功能分布复杂,再考虑到人流密度及其他相关干扰因素,卫星厅的网络工程建设总体来说较为庞大且复杂。基于以上原因,本文主
毫米波通信提供了30-300GHz的频带,可以提供千兆位的通信服务,是5G网络的一项有前景的技术。然而,由于极高的频率,毫米波信号会遭受严重的路径损耗和降雨衰减。因此,它通常与大规模天线阵列结合使用,以提供较大的波束赋形增益。要利用这一波束赋形增益,系统必须具有准确的信道状态信息。由于配置了大规模天线阵列,信道矩阵维度高,获得准确的信道状态信息面临着许多挑战,包括大量的训练开销、严重的导频污染和较
随着移动通信技术的发展,车辆与基础设施(V2I)之间的交互愈加频繁,通信需求也在不断变化。无论是为自动驾驶准备的大容量传感信息共享,还是为车载娱乐服务的高质量媒体传输,这些应用都迫切地希望增加无线网络的吞吐量。采用毫米波通信是一个可行的方案。通常,毫米波系统由于频段较高,其信号在空间衰减强,通信范围小,会采用波束成形技术提高通信链路的质量。另一方面,混合波束成形架构由于良好的经济效益,在实际工程中
基于量子力学的具有理论无条件安全性的量子密钥分发(Quan-tum Key Distribution,QKD)技术 的当前实现方案分为连续变量量子密钥分发(Continuous-Variable Quantum Key Distribution,CVQKD)和离散变量量子密钥分发(Discrete-Variable Quantum Key Distribution,DVQKD)。其中CVQKD鉴于
近年来,特征模理论在天线设计领域中广受欢迎,被广泛用于研究任意形状的辐射体或散射体的模式谐振特性。特征模式只与辐射体或散射体的几何结构和材料特性有关,而与馈电无关。该理论能够从物理角度对天线辐射机理进行解释,降低了天线设计过程中对设计者知识储备的要求,且不再依赖于设计者个人经验,对天线设计具有指导性的意义。本文从特征模理论出发,提出了一种新的广义特征值方程,用于直接反映特定模式的辐射能力,并研究了
随着世界各国对海洋重视程度的提高,海洋科技的发展引来越来越多科研工作者的关注,而水下无线通信技术便是其中重要一项技术。水声通信作为目前水下唯一有效的远距离无线通信方式,得到了广泛的应用。然而水下复杂多变的环境以及声波的特性使得水声通信技术面临诸多挑战。水声信道被公认为最复杂最具挑战的无线信道之一,窄带宽、多径效应、多普勒效应以及各种噪声都严重影响水声通信的效率与质量。水声通信过程中的多普勒效应会对
光交叉连接(Optical Cross-Connect,OXC)是波长路由光网络节点的核心部件之一,它的主要功能是执行光路交换。随着高清电视、云计算和在线游戏等高带宽业务的出现,网络带宽需求爆炸式增长,对OXC的规模提出了越来越高的要求。然而,传统OXC扩展性不足,具体表现为内部连线复杂,所需的光开关规模随OXC端口数增加而增加。为此,本文对大规模OXC的构造方法进行了研究,并提出了两种模块化的O