短时语种识别若干问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:johnlu888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语种识别技术的发展,在测试语句时长超过30s的前提下,如今的自动语种识别系统已基本能够达到实用所需的性能指标。然而在很多实际情况中,长达30s的测试时长要求是无法被大多数使用者所接受的,可当测试语句的有效时长减小到10s以下,现有语种识别系统的性能却又面临着较为严峻的挑战。本论文围绕语种识别系统在短时测试条件下识别性能不佳的问题展开研究,具体有以下几方面内容:针对短时语音段难以利用统计方法获得准确表示的问题,论文通过对短时特征易受噪声影响且在模型空间中表达不准的原因进行分析,提出了用样例的方法替代传统的统计方法以克服数据稀疏问题,将模版空间构造和特征编码引入语种识别系统,最终得到对由时长减少引起的相关差异更加鲁棒的短时语音段新表示,从而提高短时语种识别的性能。实验表明,采用基于样例的方法获得更具时长差异鲁棒性的语音段表示后,系统的短时识别性能有比较明显的提升。关于如何从短时语音段表示中有效挖掘语种信息的问题,论文提出了将深层神经网络作为语种识别系统的后端分类器,利用网络模型的多层非线性映射得到短时样本更具语种区分性的高层表达,从而更有效地对其进行分类。同时论文还对深层神经网络分类器在训练过程中遇到的过拟合问题展开了研究,通过引入dropout策略对其加以抑制。实验表明,使用深层神经网络作为语种识别系统的后端分类器对提高系统的短时识别性能有很大帮助。为了更进一步利用深层神经网络的高层表达能力,论文提出了将其应用于语种识别系统的特征提取,通过提取语种区分能力更强的短时语音段特征来提高系统的短时识别性能。最后论文对基于深层神经网络的语种识别特征进行了移位差分扩展以加入更多动态信息,并利用深层自动编码器对扩展特征进行降维。实验表明,深层神经网络作为特征提取器的使用非常有效地提升了语种识别系统在短时测试条件下的识别性能,所提取的特征经过差分扩展及非线性降维之后,系统的短时识别性能又得到进一步提升。
其他文献
以甜瓜嫩芽叶尖为材料,采用去壁-火焰干燥法进行染色体制片,发现叶尖制片要求与根尖基本一致.利用所确定的制片程序,从随机选取的27个叶尖样品中检测出两个四倍体,一个嵌合体
<正>1问题介绍SC公司5 000 t/d生产线回转窑采用液压挡轮装置(以下简称挡轮部件)控制窑的上下运行,2014年在正常生产时液压挡轮装置轴承出现故障,为节约维修时间,在现场更换
伊恩·麦克尤恩是当代英国文坛最重要的作家之一,其小说《赎罪》在全球范围内享有盛誉,充分体现了作者创造性的写作技巧和繁复的写作风格,这也对译者构成了巨大挑战。原作风
互联网、智能移动终端及其应用程序(APP)普及甚至进入校园,同时新课程改革和教育信息化也不断加强要求,推进了又一个地理教学研究新动向——开发现代信息技术中的教学资源应
信息产业是国家的支柱与战略性产业,是信息技术应用与国家信息化建设的基石.发展信息产业靠IT人才,介绍了IT人才市场状况,分析了毕业生就业难的原因,探索了IT人才培养模式的
<正> 在中华文化中,鹤不同于一般的鸟类。她总是与人们美好的期望相伴,是吉祥、长寿、忠贞、仙雅、健美的象征,形成了内涵丰富的鹤文化。历经几千年,鹤文化已渗透到中华文明
<正> 地方台与中央台在人才、经费、装备、信息等方面无法相比,但是,寸有所长,尺有所短,地方台也有自身的优势。只要扬长避短,地方台一样可以办出精品栏目,如:湖南卫视的《快
随着我国经济的快速发展,宏观经济发展战略倾向于工业制造业,因此电力的需求量越来越大,对电力行业的服务质量要求的越来越高,因此当前我国电力行业正在不断进行改革工作,以
<正>创造性思维要具有流动性和灵活性,要求学生能用不同寻常的方法去观察事物的本质特征和内在联系,研究思维定式,对于培养学生的创新思维具有重要的现实意义。思维定式妨碍
在无水乙醇中,以苯甲酰甘氨酸(C9H9NO3,Benzoyl-gly)为配体,稀土钕为中心体,合成了一种稀土二元配合物,分别以咪唑(C3H4N2,Im)或苯并咪唑(C7H6N2,Bim)为第二配体,合成了两种新型稀