视频压缩算法及其于嵌入式MPSOC的视频编码研究与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:chaosmoon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频编码压缩技术的发展,特别是H.264标准的推出,以规则块为单位的视频压缩性能得到巨大提升。如何进一步提高视频编码性能,实现比H.264压缩效率高一倍的新一代视频编码方案,是视频领域近年来的研究重点之一。本文从非规则块模型的角度出发,对视频压缩中的双向预测帧、帧间运动模型和DCT变换等方面展开研究。关键点滤波匹配是一种基于弹性模板的图像匹配方法,适合表达各种形变运动。但弹性模板对遮挡较为敏感,本文提出基于双向匹配的遮挡修正模型,有效改善部分遮挡区域的主观和客观质量;而针对图像边界匹配问题,本文提出一种无约束边界扩展模型,有效解决图像边界失配问题。   本文将基于关键点滤波匹配的图像插值用于解决视频编码中双向预测帧的压缩。首先对直接跳帧编码进行测试分析,结果表明在中低码率下,插值图像质量与传统B帧相当,总体码率可节省约5-15%。分析表明模型失效、线性插值和非线性运动的偏差是造成插值图像客观质量不高的原因。针对模型失效,提出带局部补偿的跳帧编码思想,实验结果表明带局部补偿的跳帧编码比传统B帧编码在中低码率下节省码率5-10%,图像质量略高于B帧;高码率下图像质量不如B帧,但可节省码率10-20%。针对线性插值和非线性运动失配问题,依据人眼对短时间间隔内运动特性不敏感的特点,提出带主观加权的图像质量评价准则,根据该准则,进一步证实跳帧编码在中低码率更具优势的特点。   传统规则块运动估计,不符合运动物体的不规则边界。本文提出混合块分割思想:大的规则块和小的不规则块分割相结合。据此提出基于折线的块分割方法,采用一条折线拟合规则块内的物体边界,从而提高运动估计的准确度,结果表明折线分割比传统规则块分割的性能增益约02.-0.3dB。传统二维DCT无法有效处理倾斜边界,本文提出重排DCT思想,先对像素块进行位置重排,再进行DCT,从而提高DCT系数集中性,结果表明在中高码率,性能提高0.1-0.2dB。此外,还提出重排DCT与不规则块分割相结合的编码方法,利用不规则块分割信息表达重排DCT的方向,减少所需比特数,结果表明重排DCT与不规则块分割相结合,在各个码率下,性能增益均到达0.2-0.3dB。   视频压缩性能的提高带来运算复杂度的急剧增大。嵌入式MPSOC作为一种并行计算的处理器系统,适合数据量大、运算复杂度高的视频信号处理,同时,嵌入式MPSOC也面临着存储资源有限、调度复杂等问题。本文以实验室自主研发的嵌入式多媒体MPSOC(MediaSOC3201A)为平台,以MPEG4编码为例,对嵌入式MPSOC在视频压缩中的存储优化、多核调度等相关问题进行研究。   针对数据空间优化,设计了基于宏块的编码策略,数据空间比基于宏块组的编码策略节省了约52.1%。针对单核程序存储空间不足的问题,提出一种基于主从结构的MPSOC程序覆盖机制,对于MPEG4编码,单核程序空间可节省33.6%。针对MPSOC中多处理器调度复杂的问题,提出一种面向对象的调度策略,将各个处理器上的软件模块进行统一封装,分离调度和数据通信,实现多核调度的统一化。将MPEG4编码分离为变长编码和其他功能两个模块,分配在不同处理器上,采用面向对象方法对编码过程进行调度,相对于基于程序覆盖的编码机制,编码效率提升33.19%。
其他文献
智能天线技术作为TD-SCDMA的关键技术,在减小TD-SCDMA系统中的干扰、提升系统的容量和覆盖范围有着重要的意义。本文对智能天线的算法及其在TD-SCDMA中的应用进行了研究。论
由于具有高速率,低损耗,低成本等极大的优势,超宽带(ultra-wideband,UWB)技术在短距离传输方面得到广泛应用。但在UWB通信系统中,各个用户共享空间频谱资源,每个用户依靠不同
目前,超声波检测主要采用依靠检测人员移动超声波检测探头进行超声波检测的手动工作方式,根据检测人员的经验来判断缺陷以及缺陷的类型。该方式要求检测人员具有超声波检测的经
OFDMA多址技术是OFDM技术的演进技术,具有非常好的前景。由于OFDM技术在抗多址衰落方面具有较大的优势,因此OFDMA多址技术在无线通信领域也受到了越来越广泛的关注。现如今,
短波通信是十分重要的一种通信手段,它的传输距离远、灵活性高、抗摧毁性强。但是短波通信的传输信道条件非常恶劣,严重影响了短波通信的性能。随着科学技术的不断发展,一些
无线局域网(Wireless LAN, WLAN),是一种利用无线媒介,提供无线对等和点到点连接的数据通信系统。当前存在多种无线局域网标准,而IEEE 802.11标准是其中应用最广泛的无线局域
网络和处理技术的飞速发展,为多媒体通信的普及奠定了基础。如今,工业界对视频会议、可视电话、第三代移动通信等多媒体通信产品的开发正进行着越来越多的投入。视频编码技术
Web 2.0是一种以个性化服务为核心的新型用户网络交互模式。它与传统的Web 1.0模式相比,在用户特性、微内容、个性化服务、交互式技术等方面均有显著的差异。深入地分析和研
期刊
本文主要研究基于脑电信号的情绪识别,根据脑电信号的特点和情绪的产生机制,结合已有的相关研究,对大脑额叶区进行情绪脑电的分类研究。通过对DEAP数据库的实验分析,根据愉悦