一种改进的MMSE-STSA语音增强方法

来源 :中国科学院声学研究所东海研究站 中国科学院声学研究所 | 被引量 : 0次 | 上传用户:cxddqqqqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强的目的是改进语音质量,在消除背景噪声的同时提高语音可懂度。目前一些对非平稳噪声干扰下的语音信号进行增强的方法,可以降低背景噪声,但是有时会引入不舒服的音乐噪声,而且这些方法不能很好的提高语音的可懂度,甚至使其略有下降。基于短时幅度谱估计(STSA,Short-timeSpectralAmplitude)的方法作为一种单通道语音增强方法,以其简单有效深受欢迎。   语音增强系统中一个重要组成部分即为噪声功率谱估计。传统的估计方法是在无语音段估计出噪声值,而在有语音段用此值近似代替。为了区分有语音段和无语音段,就需要对带噪语音信号进行语音活动性检测(VAD,voiceactivitydetect)。然而,语音活动性检测的可靠性在弱语音信号以及低输入信噪比的条件下急剧恶化,而且在非平稳噪声环境下严重制约了对背景噪声的追踪性能。   本文通过一个非线性函数,根据带噪语音信号的信噪比对非平稳背景噪声信号进行估计,应用最小均方误差估计方法(MMSE,minimummean-squareerror),利用估计出的噪声功率谱得到相应的谱增益,进而估计出纯净语音信号的短时幅度谱。方法中对谱增益的修正,可以进一步抑制低信噪比时的残留噪声以及降低对带噪语音信号的过抵消。本文用MATLAB实现了整个算法的仿真,并与传统的谱相减法、最小均方误差短时幅度谱估计(MMSE-STSA)方法的增强结果相比较。仿真结果表明,该算法对非平稳噪声的追踪性较好,在抑制背景噪声,减少音乐噪声的同时,提高了语音的可懂度,其计算复杂度也有很大优势,便于该算法在实际中的使用。  
其他文献
本论文包括极化SAR串扰定标方法研究和方位向天线方向图在轨测量方法研究两部分.极化SAR数据必须经过极化定标才能有效应用,串扰定标是极化定标的一个重要环节。国际上新一代星
随着我们对工业4.0领域以及工业物联网(IIoT)的深入研究,自动化技术越来越显得尤为重要。伴随着机器视觉技术的快速发展,在提高制造商产品质量水平的同时加快生产效率,可以说拥有巨大的潜力。这项技术的影响范围也在不断地扩大,各种新的应用注定会在我们的日常生活中发挥更大的作用。比如,在汽车的ADAS系统中处理目标检测与识别,使基于面部的安全机制集成到便携式电子设备以及无数其他关键任务中。为了降低延迟并
期刊
酚氧化酶(phenoloxidase,PO)在昆虫中参与黑化包被、伤口愈合、表皮硬化、色素形成等过程。PO以无活性的酚氧化酶原(prophenoloxidase,PPO)形式存在于昆虫血淋巴中,通过特异
本文通过对荣华二采区10
期刊
为了研究土壤养分对蝴蝶花的克隆生长和有性繁殖的影响,以探讨其对土壤养分异质性的有效反应,以及在有性繁殖上的适应对策。在田间实验中对蝴蝶花进行了高、中、低养分(N、P
随着我国经济的快速发展,国内机动车的数量增长迅速,城市交通拥堵问题日益突出。为了缓解交通压力,国内开始发展ITS智能交通系统(IntelligentTransportation System,简称ITS),各种
作为LTE的演进技术,LTE-A(Advanced)可以提供更高的频谱利用率、更大的覆盖范围。在LTE-A中,提高小区边缘用户的性能成为了主要的研究方向之一,而多点协作通信(Coordinated M
目前多媒体产品市场绝大多数小型扬声器因受到单元尺寸等物理条件限制存在低频还原能力差的问题。虚拟低音技术(VirtualBass)指的是针对扬声器低频截止频率高于信号低频截止
学位
图像配准是数字图像处理的重要内容,是图像对比、数据融合、变化分析和目标识别的必要前提。在图像配准中常常需要把来源于不同成像设备的图像进行配准处理,这些不同成像模式的
本文着重于将各种优化算法和人工神经网络等工具和方法应用于遥感图像分类这一研究领域,研究内容主要有以下两个部分:   第一部分,BP神经网络作为应用最广泛的人工神经网络,已