论文部分内容阅读
语音识别作为人机交互的关键技术,在工业生产及社会生活中有着很广阔的应用空间。因此,研究语音识别系统是有相当的理论和实践价值。本文首先对语音识别系统的基本概念和原理进行了简要的介绍,分析了传统的语音识别技术的优点以及其局限性,其次阐述了本文主要研究的机器学习方法即:支持向量机。主要介绍了作为支持向量机基础的统计学习理论,以及支持向量机多类分类的常用方法。本文是为了解决支持向量机的核函数因参数寻优问题,产生冗余的额外计算量,从而导致大量的时间浪费,以及支持向量机在训练过程中,将很多时间都浪费在对非支持向量的复杂计算上,特别是对于大规模数据量的语音识别系统来说,支持向量机在训练时间上不必要的开销将会更加显著。鉴于以上弊端,本文引用了基于切比雪夫多项式的核函数,切比雪夫核函数避免了因核函数改变而带来的新参数的寻优问题,以及在支持向量机的训练过程中能够获得更少的支持向量个数。同时结合了高斯核函数的优良性能,对广义的切比雪夫核函数进行了适当的改进得到修正切比雪夫核函数,它在保证广义切比雪夫核函数良好特性不变的基础上,使得预测样本的识别率得到了进一步的提高。与此同时,本文还提出了一种多类分类的支持向量预选取算法,该算法运用了核模糊C均值聚类的原理,该聚类是一种常用的典型动态聚类算法,并且具有核函数能够把模式空间的数据非线性映射到高维特征空间的优点。在核模糊C均值聚类的基础上结合了多类分类支持向量机中的一对一方法的思想,按照既定的准则把训练样本集中有可能属于支持向量的样本数据进行预选取,很大程度上减少了支持向量机的训练时间。本文应用了几种不同词汇量及信噪比的语音数据库进行了验证实验,实验取得了较好的结果,有效地提高了支持向量机分类器的学习效率和泛化性能。