论文部分内容阅读
三维音频系统能重建水平方向、垂直方向和远近距离共三个自由度的三维空间声效,在三维空间中任意空间位置生成声像,实现全三维空间包围感的逼真音效,近年来受到了广泛关注。MPEG标准工作组和中国自主知识产权的音视频国家标准组织AVS(Audio Video coding Standard)相继启动了3D音频标准化工作。3D音频技术已成为音频领域的前沿研究热点。相比耳机3D音频系统而言,扬声器3D音频系统适合于多人欣赏,应用范围更广。与传统的两声道立体声2.1和水平面单层环绕声5.1/7.1相比,现有的3D音频多声道系统具有其典型特点,同时技术实现方面也面临着特有的挑战。第一,三维音频多声道系统声道数目众多,信号数据量随声道数目的急剧上升给存储和传输带来了巨大的压力,亟需高效的三维音频多声道信号压缩编码技术。第二,3D音频与传统音频的关键差别就在于声像空间位置的自由度,对于3D音频空间声像位置的准确定位和感知无失真重建是实现逼真三维空间声效感知体验的关键。第三,3D音频对象编码能提供灵活的交互式听觉体验,但随着音频对象数量的增多,信号数据量成比例线性增长,对高效的空间音频对象编码技术提出需求。针对上述需求与挑战,本文对基于虚拟声像的三维音频空间参数感知编码技术展开了研究,研究了虚拟声像估计与重建、三维空间音频参数感知压缩编码和三维音频对象编码,以实现三维音频信号的高效存储和实时传输,确保三维音频空间感知无失真重建,提升听音者三维空间体验。(1)基于声场物理特性的虚拟声像估计与重建针对现有虚拟声像估计和重建方法中多扬声器合成声场与单声源声场分别在听音点处能量不守恒的问题,本文以点声源球面波传播理论为基础,建立基于听音点声压和粒子速度总能量守恒的约束模型,提出了虚拟声像信号估计与重建扬声器信号生成的可逆计算方法。本文方法在人头双耳处能量失真相比现有方法降低28.68%,且能带来较明显的主观空间音质提升。(2)基于空间方位感知特性的声道间空间参数编码针对现有方法中空间参数编码比特不能有效利用导致量化感知失真或量化感知冗余的问题,本文发现并证明了空间参数恰可感知差异JND与声像空间方位JND之间存在的函数映射关系,提出了空间参数JND计算模型,用于空间参数的感知量化码本设计中,能有效去除空间参数感知冗余。在标准多声道测试序列上的测试结果表明,主观空间音质相当的情况下,本方法空间参数编码码率相比MPEG最高可降低18.76%。(3)基于局部空间约束的三维空间参数动态量化编码针对现有空间音频对象编码中对象间空间参数压缩率不高的问题,本文将现有的两元组对象间一维空间参数量化编码方法改进为三元组对象间二维空间参数矢量量化编码方法,利用对象所围成的空间区域范围作为约束条件,动态选择空间参数局部矢量量化码本,能大大降低空间参数编码码率。主观音质基本相当的情况下,本文所提出的对象间空间参数编码平均码率相比MPEG方法可降低29.46%。