论文部分内容阅读
语音识别技术是一门新兴的科学技术,从上世纪60年代发展以来,已经取得了巨大的进步。我国在这方面的研究相比国外起步较晚,因此需要加强对语音识别技术的研究。语音识别技术以语音信号处理为研究对象,让机器来理解人类的自然语言,从而使该技术成为人机交互的接口。现在大多数的语音识别产品都是用软件来实现的,如能用硬件来实现,并将其广泛应用于工控和智能终端,其意义是非常重大的,同时市场前景也是十分广阔的。语音识别主要包括说话人识别、连接词识别和孤立词识别。本文研究内容主要应用于小词汇量、非特定人、孤立词的汉语语音识别芯片,主要对孤立词语音识别中的各个算法进行了研究并且对各阶段的算法进行了优化,在此基础上用硬件语言完成了识别系统的硬件实现,并进行了仿真和验证。本文研究了孤立词语音识别中用到的特征参数提取算法、量化算法、匹配模型。在诸多算法中,本文特征参数选取了梅尔倒谱系数(MFCC),量化方面使用了LBG算法和模拟退火算法,匹配模型选用了隐马尔科夫(HMM)模型。在此基础上,本文完成了如下改进:把MFCC及其高阶差分组合在一起来提高识别的稳健性;采用一词建立一个码本的方法来提高识别率;模拟退火算法中嵌套LBG算法来建立全局最优的码本;改变HMM中状态数和观察数来进一步提高识别的稳健性。通过上述改进,32个孤立词的浮点识别率达到了100%,定点识别率达到了99.2%,硬件仿真结果与C语言定点仿真结果相同;识别的稳健性有了较大的提高,在有干扰的情况下,仍能正确的识别。