基于虚拟声像的三维音频空间参数感知编码研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户：xuzhangzhe

【摘要】

：

三维音频系统能重建水平方向、垂直方向和远近距离共三个自由度的三维空间声效,在三维空间中任意空间位置生成声像,实现全三维空间包围感的逼真音效,近年来受到了广泛关注。M

【作者】

：

高丽

【出处】

：

武汉大学

【发表日期】

：

2016年01期

【关键词】

：

三维音频虚拟声像声场重建空间参数感知编码面向对象音频编码

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

三维音频系统能重建水平方向、垂直方向和远近距离共三个自由度的三维空间声效,在三维空间中任意空间位置生成声像,实现全三维空间包围感的逼真音效,近年来受到了广泛关注。MPEG标准工作组和中国自主知识产权的音视频国家标准组织AVS(Audio Video coding Standard)相继启动了3D音频标准化工作。3D音频技术已成为音频领域的前沿研究热点。相比耳机3D音频系统而言,扬声器3D音频系统适合于多人欣赏,应用范围更广。与传统的两声道立体声2.1和水平面单层环绕声5.1/7.1相比,现有的3D音频多声道系统具有其典型特点,同时技术实现方面也面临着特有的挑战。第一,三维音频多声道系统声道数目众多,信号数据量随声道数目的急剧上升给存储和传输带来了巨大的压力,亟需高效的三维音频多声道信号压缩编码技术。第二,3D音频与传统音频的关键差别就在于声像空间位置的自由度,对于3D音频空间声像位置的准确定位和感知无失真重建是实现逼真三维空间声效感知体验的关键。第三,3D音频对象编码能提供灵活的交互式听觉体验,但随着音频对象数量的增多,信号数据量成比例线性增长,对高效的空间音频对象编码技术提出需求。针对上述需求与挑战,本文对基于虚拟声像的三维音频空间参数感知编码技术展开了研究,研究了虚拟声像估计与重建、三维空间音频参数感知压缩编码和三维音频对象编码,以实现三维音频信号的高效存储和实时传输,确保三维音频空间感知无失真重建,提升听音者三维空间体验。(1)基于声场物理特性的虚拟声像估计与重建针对现有虚拟声像估计和重建方法中多扬声器合成声场与单声源声场分别在听音点处能量不守恒的问题,本文以点声源球面波传播理论为基础,建立基于听音点声压和粒子速度总能量守恒的约束模型,提出了虚拟声像信号估计与重建扬声器信号生成的可逆计算方法。本文方法在人头双耳处能量失真相比现有方法降低28.68%,且能带来较明显的主观空间音质提升。(2)基于空间方位感知特性的声道间空间参数编码针对现有方法中空间参数编码比特不能有效利用导致量化感知失真或量化感知冗余的问题,本文发现并证明了空间参数恰可感知差异JND与声像空间方位JND之间存在的函数映射关系,提出了空间参数JND计算模型,用于空间参数的感知量化码本设计中,能有效去除空间参数感知冗余。在标准多声道测试序列上的测试结果表明,主观空间音质相当的情况下,本方法空间参数编码码率相比MPEG最高可降低18.76%。(3)基于局部空间约束的三维空间参数动态量化编码针对现有空间音频对象编码中对象间空间参数压缩率不高的问题,本文将现有的两元组对象间一维空间参数量化编码方法改进为三元组对象间二维空间参数矢量量化编码方法,利用对象所围成的空间区域范围作为约束条件,动态选择空间参数局部矢量量化码本,能大大降低空间参数编码码率。主观音质基本相当的情况下,本文所提出的对象间空间参数编码平均码率相比MPEG方法可降低29.46%。

其他文献

电压互感器二次压降与计量误差

发电厂和变电站中的电压互感器一般与安装在控制室内的计量仪表距离较远，电压互感器二次回路导线很长，且中间还有刀开关、熔断器、接线端子和继电保护装置等，它们有电阻，电抗等参

期刊

电压互感器二次回路电压降电能计量误差

关于面向对象和结构化两种软件开发方法创新规律的探讨

软件工程理论中比较重要的内容是关于软件开发的方法，它对软件开发时“该做什么”和“怎样做”进行了详细明确的一一解答。不同时期，人们对软件开发问题的解决方法也各不相同，不

期刊

面向对象结构化软件开发方法创新规律探讨

湖州尚武传统述略

江南历史文化名城湖州有着深厚的尚武文化底蕴，名家辈出。尤其明朝时期，湖州尚武之风尤为盛兴。近代以来湖州的尚武传统进一步发展，方兴未艾，武术团体增多，使得湖州的武术发展独具

期刊

民族传统体育湖州尚武传统

基于医保费用审核的医保监管完善对策

随着我国持卡就医人员的不断增加,当前医疗系统中人工审核医疗费用的方式逐渐显现出不足。从当前国内医疗系统中医疗费用审核信息化现状来看,现有信息审核系统存在较大的局限

期刊

医疗费用审核医保监管信息化

民办珠心算教育创新与实践研究报告

<正>珠算是中华民族的优秀文化遗产,它有着数千年的光辉历程,凭借其计算功能流传千百年至今,并在全世界传播。2013年12月4日,中国珠算被列入人类非物质文化遗产代表作名录,珠

期刊

珠心算教育创新与实践

运筹学在中石化销售企业的应用初探

介绍了运筹学的主要含义，分析了石化销售企业应用运筹学的必要性，并就运筹学应用于油品价格决策和网点建设进行了实例演示和重点说明。

期刊

销售企业经营管理决策运筹学

替诺福韦艾拉酚胺半D-(-)-酒石酸盐的制备及其稳定性研究

目的制备替诺福韦艾拉酚胺半D-（-）-酒石酸盐,并开展稳定性研究。方法以替诺福韦（PMPA）为原料,经亚磷酸三苯酯缩合、二氯亚砜氯代、L-丙氨酸异丙酯缩合制得替诺福韦艾拉酚胺,再与D

期刊

替诺福韦艾拉酚胺替诺福韦D-(-)-酒石酸稳定性

标准分与教师评价

运用标准分对教师进行评价让大家真实地看到数据表象后面的本质,避免不同的外部因素造成的不和谐,从而公正地反映教师间的差异,科学地揭示相关教师的发展潜力。

期刊

教师评价标准分应用

经济体制、资源配置与经济发展模式

在计划经济、转轨经济、市场经济体制下,中国经济发展呈现出不同的模式,不同体制下的经济发展模式与当时的资源配置方式紧密相关。在市场经济体制完善阶段,资源配置呈现出市

期刊

经济体制资源配置经济发展模式

城市博物馆,城市记忆的殿堂——西安博物院文化遗产管理工作的探讨

西安博物院抓住历史发展机遇,狠抓基础建设,规范博物馆管理。从物质文化遗产及非物质文化遗产等多角度实现城市博物馆记忆城市的功能。城市博物馆是连接城市昨天、今日和明天

会议

文化遗产城市记忆近现代史

基于虚拟声像的三维音频空间参数感知编码研究

其他学术论文