基于计算听觉场景分析的语音预处理系统

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:QCLHQCLH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代通信技术的高速发展,空间环境、噪声以及干扰的类型都变得越来越复杂,语音信号往往会受到环境噪声的污染,造成语音质量的明显下降。传统的语音识别工具(例如IBM公司的ViaViove)对纯净语音的识别效果较为理想,然而,在低信噪比以及存在噪声干扰的移动环境下,这类语音识别系统的性能就会急剧下降。因此,如何提高移动环境下语音识别系统的抗干扰能力成为了当前亟待解决的一个问题。现有的语音识别技术大多都是单纯基于模式识别而不考虑对语音的净化,针对此问题,本文实现了一种基于计算听觉场景分析(CASA)的语音识别系统。与传统的方法不同的是,该识别系统在语音识别引擎前端添加了CASA的语音预处理模块以提高移动环境下语音识别正确率。本文基于CASA的预处理模块,通过使用互通道相关以及时域连续性等组合线索,将来自同一声源的听觉元素合并成听觉片段,从而将目标语音从噪声中分离出来。此外,本文利用隐马尔可夫模型工具包(HTK)来构建一中文语音数据库,并通过端点检测的方法对数据库中的语音进行Mel频率倒谱系数(MFCC)特征的提取。最后,利用参数重估算法结合语音的MFCC特征进行语法训练,得到了一个隐马尔可夫模型(HMM),并以该HMM模型为基础搭建基于CASA的语音识别系统,即CASA语音识别系统。为了验证所提算法的有效性,仿真实验设定了两种类型噪声,即马路噪声和室内咖啡馆噪声。并在不同信噪比的环境下,验证CASA语音识别系统对噪声的鲁棒性。仿真结果表明,对比现有的语音识别系统,本文所提出的CASA语音识别系统具有更强的鲁棒性,保证了在低信噪比环境下语音识别的正确率。
其他文献
随着信息时代的到来,作为计算机通信、信息存储、internet网络传输等信息技术的关键环节,图像压缩编码算法的研究是当今信息技术里最活跃的研究领域之一,尤其是进入21世纪以后,微
如何提高语文教学效率,有一点是达成共识的,那就是充分调动学生的学习主动性和积极性,使学生真正成为教学活动的主体.只有学生积极主动参与学习,充分地思考,教师的努力才能取
孟子有云:“仁者无敌”,是为梁惠王如何治国提出了最为核心的建议;宋太祖赵匡胤在开国之初以怀柔政策巩固政权,收效颇丰.在此,如果将班级比作一个小国,教师作为班级中的领导
21世纪,以计算机和互联网为代表的当代信息技术正在影响着我们的教学环境、改变着我们的教学模式.多媒体作为一种先进的教学手段,走进了小学英语课堂,显示了它无与伦比的优势
作文教学是语文教学的一个重要组成部分,而小学低年级的看图写话则是作文教学的准备阶段,是培养学生观察能力、思维能力和表达能力的有效途径,能为高年级的篇章训练打下坚实
教学价值观,是指教学活动和教学主体需要的关系,即教学活动应该满足教学主体的哪些需要.相应地,政治教学价值观就是政治教学活动和政治教学主体需要的关系,即政治教学活动能
JPEG2000压缩标准不仅被应用于数码照相机和扫描仪中,也被广泛应用于网络和无线通信领域。然而由于该压缩标准具有较高复杂度,目前该压缩标准的硬件实现方面在国内仍存在很大的
本实验通过叶面喷施液态生物肥的方式,早春对茶树追施“绿之源”生物有机肥,观测其与对照之间的感官审评和内含物的差异,来探讨液态生物肥对茶叶品质的影响。 In this exper
我们知道,小学阶段,尤其是一、二年级,识字教学是一项重要的任务.到了初中,识字似乎显得不太重要了,许多教师和学生便忽视了它.其实,初中阶段依然肩负着打好各种知识基础的重
从事语文教学的教育者都知道作文在语文学习中占据着极其重要的位置.“作文难,怕作文”,这是山区孩子学习语文所面临的最头痛的一件事.大多数山区的学生由于受家庭条件和交通