论文部分内容阅读
摘要: 基于提高教学平台中音视频处理的速度及系统的灵活性问题,在采用H.264数字视频编码标准的情况下分析H.264技术特点,着重说明H.264的实现方法及改进办法,给出系统的实现方案,该系统基本满足教学的需要,便于与多媒体服务器搭配使用,同时降低制造和维护成本。
关键词: 视频压缩;H.264;自适应六边形算法
中图分类号:TP311.52文献标识码:A文章编号:1671-7597(2011)0320073-01
1 概述
H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:Joint Video Team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10部分。H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。但它采用“回归基本”的简洁设计,不用众多的选项,获得比H.263++好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需求;它的基本系统是开放的,使用无需版权。在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4×4块的整数变换、分层的编码语法等。这些措施使得H.264算法具有很的高编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。本文主要阐述了基于H.264视频压缩教学平台的实现。
2 H.264的实现方法及改进
2.1 开发平台介绍
本文的H.264解码器所采用的多路实时图像处理平台DM642EVM是基于TI公司的TMS320DM642芯片设计的评估开发板。板载DSP的计算能力达到480OMIPS,可以进行实时的多路视频采集,实现复杂的音/视频压缩算法,并带有以太网口,可通过网络传输数据。
2.2 H.264的基本实现方法
H.264实现基本采用的是运动估计算法。视频序列实际上是一个静止图像的序列,当它们以每秒钟不小于24帧的速度连续显示的时候,由于人眼的视觉暂留效应,看起来就是连续的图像。因此,在一般情况下,相邻帧间的内容实际相差不多(除了场景切换等),有很大一部分甚至是完全一样的,所以帧与帧之间存在着很大的时间相关性,即时间冗余。通过运动估计可以有效的去除时间冗余,保留帧间的有用信息,大幅度提高视频压缩的效率。运动估计的效率高低将对压缩全过程产生重大影响。
2.3 改进的算法
本文提出了基于预测的自适应六边形搜索法,该算法主要包含了以下几项核心技术:预判别零运动矢量,设定阀值对静止块直接终止运动估计;使用空间相邻块和时间相邻块估计当前块的运动类型;根据运动类型自适应选择搜索起始点;搜索策略结合使用了六边形搜索法和小钻石形搜索法。
自适应六边形算法流程如下:
1)用HSP搜索法进行匹配运算,如果最小块误差(MBD)点出现在中心点,则转到3),否则转到2);
2)以上一次找到的湘D点为中心点,转到第一步;
3)以上一次找到的MBD点为中心点,用SDSP模板代替HSP模板进行匹配运算,在SDSP下的5个点中,MBD点的位置即提供最佳匹配块的运动矢量。一个自适应六边形算法的搜索过程,比较六边形搜索法和钻石搜索法,不难得知,HSP模板包含7个搜索点,而LDSP模板包含9个搜索点,因而在粗定位时HSP搜索法比LDSP搜索法计算复杂度低。而且,HSP比LDSP更接近于圆,其水平方向的顶点到中心点的距离为2像素,对角方向的顶点到中心点的距离为石像素。使用HsP在匹配窗移动时,沿水平方向模板的梯度下降速度为2像素/步,沿对角方向模板的梯度下降速度为万像素/步,高于LDsP扼像素/步的搜索速度,且新增搜索点数与方向无关,不管最小点在六边形的边点还是角点,在进行下一次搜索时,都只需要计算3个点。
3 系统的实现
主要实现远程场景音频视频的采集、数字化、音/视频的压缩和解压、摄像头系统的控制等功能。远程场景及音视频压缩信息通过入网设备在Internet上实现远程实时传输。接收端对接收到的数据进行分解、恢复等,最终由显示器和扬声器回放出来。
此系统主要按照MPEG提出音视频压缩标准,基于VPM642的DSP视频处理板卡,使其在DSP的实时操作系统DSP/BIOS的环境下运行,实现视频采集驱动程序,并进一步描述采用EDMA(增强的直接存储器存取控制器)的数字视频图像信号的实时传输。在该实时系统中,DSP芯片作为控制核心、一方面要管理数据采集系统、存储器和通信接口;另一方面要对图像压缩编码及压缩效果进行调解,对数据速率实时控制。系统实现方案图如下图所示:
4 总结
总结本文提出的自适应六边形搜索法,使基于H.264标准的视频压缩编码的复杂度有了很大的简化。其中自适应六边形搜索法从两个方面对传统的运动估计算法做了改进。首先,在宏块的运动估计中,以DS搜索法为基础,提出了基于预测的六边形搜索法,减少了计算量,提高了搜索速度;其次,搜索具有自适应性,可以根据运动块的类型确定搜索策略。实验结果表明,新的算法有效的降低了搜索点数,搜索精度的也比较高,特别是进行小运动估计,搜索点数少,搜索速度更快。这样以来,软硬件相结合实现音视频的处理,处理速度快且系统灵活性强;充分考虑硬件升级的可行性;便于与多媒体服务器搭配使用;制造和维护成本低,有利于教学的开展和实施。
参考文献:
[1]郭继展、郭勇、苏辉,程序算法与技巧精选,机械工业,2008.
[2]张涛,多媒体技术与虚拟现实,清华大学,2008.02.
[3](美)威德罗、斯特恩斯,自适应信号处理(英文版),机械工业,2008.
[4]彭妙颜、周锡韬,信息化音视频设备与系统工程,人民邮电,2008.
注:“本文中所涉及到的图表、公式、注解等请以PDF格式阅读”
关键词: 视频压缩;H.264;自适应六边形算法
中图分类号:TP311.52文献标识码:A文章编号:1671-7597(2011)0320073-01
1 概述
H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:Joint Video Team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10部分。H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。但它采用“回归基本”的简洁设计,不用众多的选项,获得比H.263++好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需求;它的基本系统是开放的,使用无需版权。在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4×4块的整数变换、分层的编码语法等。这些措施使得H.264算法具有很的高编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。本文主要阐述了基于H.264视频压缩教学平台的实现。
2 H.264的实现方法及改进
2.1 开发平台介绍
本文的H.264解码器所采用的多路实时图像处理平台DM642EVM是基于TI公司的TMS320DM642芯片设计的评估开发板。板载DSP的计算能力达到480OMIPS,可以进行实时的多路视频采集,实现复杂的音/视频压缩算法,并带有以太网口,可通过网络传输数据。
2.2 H.264的基本实现方法
H.264实现基本采用的是运动估计算法。视频序列实际上是一个静止图像的序列,当它们以每秒钟不小于24帧的速度连续显示的时候,由于人眼的视觉暂留效应,看起来就是连续的图像。因此,在一般情况下,相邻帧间的内容实际相差不多(除了场景切换等),有很大一部分甚至是完全一样的,所以帧与帧之间存在着很大的时间相关性,即时间冗余。通过运动估计可以有效的去除时间冗余,保留帧间的有用信息,大幅度提高视频压缩的效率。运动估计的效率高低将对压缩全过程产生重大影响。
2.3 改进的算法
本文提出了基于预测的自适应六边形搜索法,该算法主要包含了以下几项核心技术:预判别零运动矢量,设定阀值对静止块直接终止运动估计;使用空间相邻块和时间相邻块估计当前块的运动类型;根据运动类型自适应选择搜索起始点;搜索策略结合使用了六边形搜索法和小钻石形搜索法。
自适应六边形算法流程如下:
1)用HSP搜索法进行匹配运算,如果最小块误差(MBD)点出现在中心点,则转到3),否则转到2);
2)以上一次找到的湘D点为中心点,转到第一步;
3)以上一次找到的MBD点为中心点,用SDSP模板代替HSP模板进行匹配运算,在SDSP下的5个点中,MBD点的位置即提供最佳匹配块的运动矢量。一个自适应六边形算法的搜索过程,比较六边形搜索法和钻石搜索法,不难得知,HSP模板包含7个搜索点,而LDSP模板包含9个搜索点,因而在粗定位时HSP搜索法比LDSP搜索法计算复杂度低。而且,HSP比LDSP更接近于圆,其水平方向的顶点到中心点的距离为2像素,对角方向的顶点到中心点的距离为石像素。使用HsP在匹配窗移动时,沿水平方向模板的梯度下降速度为2像素/步,沿对角方向模板的梯度下降速度为万像素/步,高于LDsP扼像素/步的搜索速度,且新增搜索点数与方向无关,不管最小点在六边形的边点还是角点,在进行下一次搜索时,都只需要计算3个点。
3 系统的实现
主要实现远程场景音频视频的采集、数字化、音/视频的压缩和解压、摄像头系统的控制等功能。远程场景及音视频压缩信息通过入网设备在Internet上实现远程实时传输。接收端对接收到的数据进行分解、恢复等,最终由显示器和扬声器回放出来。
此系统主要按照MPEG提出音视频压缩标准,基于VPM642的DSP视频处理板卡,使其在DSP的实时操作系统DSP/BIOS的环境下运行,实现视频采集驱动程序,并进一步描述采用EDMA(增强的直接存储器存取控制器)的数字视频图像信号的实时传输。在该实时系统中,DSP芯片作为控制核心、一方面要管理数据采集系统、存储器和通信接口;另一方面要对图像压缩编码及压缩效果进行调解,对数据速率实时控制。系统实现方案图如下图所示:
4 总结
总结本文提出的自适应六边形搜索法,使基于H.264标准的视频压缩编码的复杂度有了很大的简化。其中自适应六边形搜索法从两个方面对传统的运动估计算法做了改进。首先,在宏块的运动估计中,以DS搜索法为基础,提出了基于预测的六边形搜索法,减少了计算量,提高了搜索速度;其次,搜索具有自适应性,可以根据运动块的类型确定搜索策略。实验结果表明,新的算法有效的降低了搜索点数,搜索精度的也比较高,特别是进行小运动估计,搜索点数少,搜索速度更快。这样以来,软硬件相结合实现音视频的处理,处理速度快且系统灵活性强;充分考虑硬件升级的可行性;便于与多媒体服务器搭配使用;制造和维护成本低,有利于教学的开展和实施。
参考文献:
[1]郭继展、郭勇、苏辉,程序算法与技巧精选,机械工业,2008.
[2]张涛,多媒体技术与虚拟现实,清华大学,2008.02.
[3](美)威德罗、斯特恩斯,自适应信号处理(英文版),机械工业,2008.
[4]彭妙颜、周锡韬,信息化音视频设备与系统工程,人民邮电,2008.
注:“本文中所涉及到的图表、公式、注解等请以PDF格式阅读”