论文部分内容阅读
语音识别是语音信号处理的一个重要方面,是人机交互技术的基础,有着广阔的应用前景。因此,对语音识别进行研究具有重要的理论价值和实际意义。本文首先系统地介绍了语音识别的基本原理,分析了目前主要的语音识别方法的局限性和不足,概述了本文研究的基础——统计学习理论和支持向量机方法,分析了支持向量机在语音识别技术中的应用前景。为了验证支持向量机在语音识别系统中的识别效果,本文分别构建了基于线性核支持向量机、径向基核支持向量机、三阶多项式核支持向量机以及Sigmoid核支持向量机的非特定人孤立词语音识别系统,并进行了大量的仿真实验。实验结果表明,前三种支持向量机应用于语音识别系统中均取得了优于隐马尔可夫模型的识别结果,并且支持向量机的运行速度也优于隐马尔可夫模型;而Sigmoid核支持向量机应用于语音识别系统中却得到了不尽如人意的识别结果。因此,核函数的不同直接影响着支持向量机的分类性能,从而影响了语音识别系统的识别效果。其次,为了研究在核函数相同的情况下,核参数和惩罚因子的不同取值对支持向量机推广性能的影响,本文构建了基于径向基核函数支持向量机的非特定人孤立词语音识别系统。在实验中,分别取了核参数和惩罚因子的三组不同的值进行了语音识别实验。实验结果表明,核参数和惩罚因子的不同取值也会影响支持向量机的推广性能,从而影响语音识别系统的识别效果。核函数的类型、核参数以及惩罚因子的选取直接影响着支持向量机语音识别系统的识别效果。然而,到目前为止,支持向量机的核函数、核参数及惩罚因子的选择还没有科学的方法,它们的选择只能根据经验、大量的反复实验进行对比等方法来进行选择,带有很大的局限性。针对这个问题,本文做了初步的研究,实现了在核函数类型确定的前提下,用粒子群优化算法对核参数和惩罚因子的优化,并用基于优选参数值的支持向量机进行语音识别实验,识别率得到了一定的改善和提高。