基于广义自回归条件异方差模型的语音增强方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:DFHGFD43
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动通信和语音识别系统等语音信号处理系统不可避免的受到背景噪声的影响。近年来,以消除背景噪声、改善语音质量的语音增强技术一直是语音信号处理领域的热点问题。本文在传统的统计模型方法框架原理的基础上利用金融等领域广泛应用的广义自回归条件异方差(GARCH,Generalized AutoregressiveConditional Heteroskedasticity)模型原理,在先验信噪比估计、噪声估计等方面做了深入研究,提出了一套基于GARCH模型的语音增强方案。本文所提算法可以在有效的消除噪声的同时,保证增强后的语音质量。  本文研究工作主要体现在以下几个方面:  首先,本文简要回顾了基于统计模型的增强方法框架原理并研究了现有经典的先验信噪比估计方法。通过研究广义自回归条件异方差模型在时频域对语音信号建模的理论方法,提出了一种基于β阶GARCH模型的先验信噪比估计算法,该算法考虑到语音信号在不同频带的特点,利用β阶GARCH模型对语音信号建模,并在临界带中利用不同子带的信噪比等信息更新模型阶β的值。针对本文提出的β阶GARCH模型参数选取问题,引入了一种自相关方法并通过Levinson-Durbin算法实时更新模型的参数。进一步,考虑到语音存在性的问题,为了更好的消除噪声,本文提出了一种带有软VAD(话音激活检测)的β阶GARCH模型先验信噪比估计算法,引入了计算子带谱熵的方法,并利用谱熵信息控制软VAD函数。该算法应用到语音增强中能够获得较好的语音增强效果且性能优于对比方法。  其次,本文分析了经典的噪声估计算法。在深入研究最小控制递归平均(MCRA,Minima-Controlled Recursive Averaging)算法的基础上,为了提高噪声估计方法的性能,利用GARCH模型在时频域对噪声信号建模,提出了基于最小控制GARCH(MC-GARCH,Minima-Controlled GARCH)模型的噪声估计算法,并利用均方误差测试方法对其进行了测试。测试结果显示,本文提出的MC-GARCH噪声估计算法能够较为为准确的估计噪声信号的功率谱,且性能更优。  最后利用本文提出的基于GARCH模型的先验信噪比估计算法和噪声估计算法,实现一套完整的基于GARCH模型的语音增强算法。并采用分段信噪比提升,谱失真,PESQ(Perceptual Evaluation of Speech Quality)等测试标准对本文所提各算法的语音增强性能进行测试,测试结果表明,本文所提算法能够获得更好的噪声消除效果、提高增强语音的质量。
其他文献
细胞凋亡(apoptosis),又称细胞程序死亡(programmed cell death,PCD),是机体主动程序化地导致细胞死亡的过程。1979年在日本发现的鸡贫血病毒(chicken anemia virus,CAV)的VP3基
该文讨论了具有快速频率捷变能力、低相位噪声的微波频率源.该频率源频率范围在C波段,有840MHz的带宽.在常用的三种频率合成方案--直接合成法、间接(锁相)合成法和直接数字合
该文就视网膜血管形态的识别方法进行了研究,对视网膜血管形态识别过程中的一些问题进行了论述,采用了弹性拓扑匹配模式,提出了以闭合网孔几何周长为拓扑特征的网孔周长法.该
变换编码可以获得比较高的频率分辨率和压缩效率.但是传统的变换编码存在着不可避免的前回声和边缘噪声.该文仔细研究了由美国杜比实验室开发的宽带音频变换编码算法,采用自
该文研究的问题是雷达跟踪低空目标时的多路径传播现象.对于连续波雷达和造成多路径效应的环境给出了一个完整的仿真模型.对仿真模型中的每一个组成部分都进行了详细的介绍.
该论文主要围绕掺铒光纤放大器在WDM系统中的某些应用问题进行了一些理论上的分析与研究,并且利用现有设备对掺铒光纤放大器增益特性进行了实验研究.
素质教育是我们的既定方针和发展方向,这一点勿应质疑,素质教育是世界教育发展的主流和趋势,我们不可能回到八股文中去,也不能一味推行应试教育。面对当前我国初中素质教育中出现
该文在论述电磁仿真基本原理的基础上,研究了两种适用于共面波导电磁仿真的方法:对偶法和等效虚带法.解决了实际应用这两种方法所面临的问题,成功地实现了对UMMIC的电磁仿真.
该课题的研究目的在于:1.研究在超媒体技术中用户发生迷航的原因,以及各种可能的导航方法和它们的优缺点;2.研究Internet超文本协议(HTTP)规范和运行结构,阐述如何在实际应用