【摘 要】
:
随着多媒体时代的到来,视频数据大量地出现在人们的日常生活中。视频数据具有连续性强、数据量大的特点,因此视频压缩技术对于视频的储存与传输具有重要意义。近年来,深度学习在许多领域取得了突破性成果,也给出了视频压缩技术新的解决方案,基于深度学习的视频压缩成为了一个备受关注的全新领域。目前该领域的研究取得了一定的成果,但是视频的压缩性能仍然有可以提升的空间,值得继续研究。本文以基于深度学习的视频压缩为研究
论文部分内容阅读
随着多媒体时代的到来,视频数据大量地出现在人们的日常生活中。视频数据具有连续性强、数据量大的特点,因此视频压缩技术对于视频的储存与传输具有重要意义。近年来,深度学习在许多领域取得了突破性成果,也给出了视频压缩技术新的解决方案,基于深度学习的视频压缩成为了一个备受关注的全新领域。目前该领域的研究取得了一定的成果,但是视频的压缩性能仍然有可以提升的空间,值得继续研究。本文以基于深度学习的视频压缩为研究内容,包含帧内压缩与帧间压缩,主要工作如下:(1)为了提升卷积神经网络模型的帧内与帧间压缩性能,受到注意力机制的启发,本文设计了密集块注意力单元,将注意力机制引入卷积神经网络中,提升了神经网络的拟合能力。此外受到密集连接网络的启发,密集块注意力单元采用了密集连接的设计,使该模块可以得到更加充分的训练。(2)本文提出了一种基于注意力机制的帧内压缩算法。该算法采用卷积神经网络对输入图像提取特征信息,将特征信息进行量化与算术编码,实现视频的帧内压缩。通过引入注意力机制与质量增强网络,算法的帧内压缩性能有显著的提升,与已有基于卷积神经网络的帧内压缩算法相比,本文算法在压缩性能上具有明显的优势。(3)本文提出了一种基于多帧信息融合的帧间压缩算法。该算法利用光流进行运动补偿,消除视频的时间冗余。为了减小视频压缩带来的损失,设计了重建帧质量增强网络,利用多张参考帧,采用卷积神经网络对重建帧进行质量增强。通过引入注意力机制与重建帧质量增强网络,本文算法实现了高效的帧间压缩。
其他文献
随着我国信息化建设的推进,网络基础设施的不断完善和各种网络应用的普及给我们的生活带来诸多便利的同时,企图对网络进行入侵或破坏的各种网络异常行为也在不断增加。网络异常行为检测有利于及时地对异常情况进行预警和响应,避免或降低异常行为所带来的损失。如何对网络异常行为进行有效检测已成为网络安全领域的重要研究课题。网络行为通常以包和流作为数据载体,近年来基于包的网络异常行为检测和基于流的网络异常行为检测是两
多目标跟踪是计算机视觉中的一个重要研究方向,其在学术研究和实际应用中都有重大的意义。在安防系统、自动驾驶、人机交互等方面有很高的应用价值。现在最常用的多目标跟踪框架是基于检测的多跟踪,其主要是结合检测器提供的检测结果来设计一套有效的关联度量和关联算法,从而将这些检测结果匹配起来,完成多目标跟踪任务。本文主要针对多目标跟踪中的运动建模和外观建模两个方面展开研究,并且结合实际应用分析多目标跟踪中存在的
柔性可穿戴传感器凭借柔性、可形变的特性而备受关注,柔性器件可以广泛应用于人体健康监测、机器人智能传感、人机交互、医疗康复等诸多领域,具有很好的发展前景。基于传统集成电路的柔性器件制备工艺已经发展成熟,但是由于其较高的制备成本以及对材料的要求严格等问题,限制了该工艺在制备柔性器件领域的应用。目前已经发展了多种新型柔性器件制备工艺,如丝网印刷、掩模喷涂以及静电纺丝等工艺,具有制备流程简单、成本低以及易
视觉目标跟踪(Visual Target Tracking)是对图像序列中的运动目标进行检测、提取、识别和跟踪的一类技术,主要任务是为了获得运动目标的运动参数,从而实现对运动目标的行为理解,以完成更高一级的检测任务。目标跟踪算法在公共安防、工厂生产、交通管控等相关场景有着极为广泛的应用。对于视觉目标跟踪算法的研究在计算机视觉领域一直备受关注。尽管在像素域的相关算法研究已经取得了很大的进步,尤其在近
近年来,在大数据与高性能计算平台的支撑下,深度卷积神经网络因其对于图像数据的强大非线性拟合能力、高度特征抽象能力和自动特征表达能力而在各类计算机视觉任务中取得了卓越性能。然而其在性能提升的同时也产生了繁重的计算开销、巨大的内存消耗以及超量的存储占用,进而限制了其向资源受限终端的部署,以及在时间敏感的实际场景中的应用。基于此,本文聚焦于基于变分贝叶斯的网络剪枝技术,深入研究变分贝叶斯理论在卷积神经网
移动传感器网络(mobile sensor network,MSN)因其具有自组织性、可扩展性及灵活性的特点,常被应用于如战场监控、灾后搜救等空间监测任务中。传感器在空间中的覆盖情况直接反映了MSN所能提供的感知服务质量,合理的节点部署可以帮助节点更好地感知环境信息,完成监测任务。当监测区域内出现目标时,MSN不仅需要对目标进行持续的跟踪,还应继续对其他区域进行搜索,这对节点的协作和适应能力提出了
高分辨率的合成孔径雷达(SAR)图像在诸多领域均有重要的应用价值,然而,由于硬件性能限制、成像条件复杂等不利因素,并且受到本身固有的乘性相干斑噪声的影响,往往获得的SAR图像分辨率都会受到严重降低。而图像的超分辨率重建,不仅可以提高图像的分辨率,而且通过引入新的高频信息,如边缘、纹理等,同时在一定程度上降低噪声、杂波等,使得图像的整体质量得到提高。近年来基于深度学习的自然图像超分辨取得了巨大的成功
深度学习网络,因其具有强大的学习与表达能力,目前已被广泛运用在语音识别、自然语言处理等领域。其中网络结构是深度学习应用的基础。研究新型的网络结构是目前研究的主流,是突破现有网络局限性的关键,对于推动深度学习网络的发展具有重要意义。现有的深度学习网络模型,经历了一个以数据拟合为目标,由浅层到深层的发展过程,其发展目前面临以下瓶颈:首先,近年来在大多数任务中,深度学习网络性能提升极其有限。其次,训练好
近年来,科学技术的飞速发展,对加速度振动测量技术提出了更高的要求。传感器不仅需要能够耐受更高的温度,还需要有更高的电荷灵敏度。发展高温压电加速度传感器恰恰是能够满足这一要求的突破口。本论文基于旋转切型对压电加速度传感器进行优化设计,制备了高温压电加速度传感器。常温和高温特性测试表明,该传感器具有较大电荷灵敏度。本论文选择硅酸镓钽钙(CTGS)晶体作为传感器设计中的压电敏感材料,并采用剪切型结构设计
耐高温高压压力传感器在航空、石油以及汽车领域的应用越来越广泛,需求也越来越大,但我国对耐高温高压压力传感器的研究相对落后,国内市场的高端耐高温、高压压力传感器主要靠进口。世界各国对耐高温、耐高压的传感器的研究较为深入,但对可同时承受高温、高压的压力传感器的研究相对较少。且目前的压力传感器市场走势偏向于将器件微型化、小型化,最好可集成。所以研究可同时耐高温与高压的压力传感器,并实现传感器的微型化对于