支持向量机样本预选取技术在语音识别中的应用研究

来源 :太原理工大学 | 被引量 : 2次 | 上传用户:ajdpwsy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别作为人机交互的关键技术,在工业生产及社会生活中有着很广阔的应用空间。因此,研究语音识别系统是有相当的理论和实践价值。本文首先对语音识别系统的基本概念和原理进行了简要的介绍,分析了传统的语音识别技术的优点以及其局限性,其次阐述了本文主要研究的机器学习方法即:支持向量机。主要介绍了作为支持向量机基础的统计学习理论,以及支持向量机多类分类的常用方法。本文是为了解决支持向量机的核函数因参数寻优问题,产生冗余的额外计算量,从而导致大量的时间浪费,以及支持向量机在训练过程中,将很多时间都浪费在对非支持向量的复杂计算上,特别是对于大规模数据量的语音识别系统来说,支持向量机在训练时间上不必要的开销将会更加显著。鉴于以上弊端,本文引用了基于切比雪夫多项式的核函数,切比雪夫核函数避免了因核函数改变而带来的新参数的寻优问题,以及在支持向量机的训练过程中能够获得更少的支持向量个数。同时结合了高斯核函数的优良性能,对广义的切比雪夫核函数进行了适当的改进得到修正切比雪夫核函数,它在保证广义切比雪夫核函数良好特性不变的基础上,使得预测样本的识别率得到了进一步的提高。与此同时,本文还提出了一种多类分类的支持向量预选取算法,该算法运用了核模糊C均值聚类的原理,该聚类是一种常用的典型动态聚类算法,并且具有核函数能够把模式空间的数据非线性映射到高维特征空间的优点。在核模糊C均值聚类的基础上结合了多类分类支持向量机中的一对一方法的思想,按照既定的准则把训练样本集中有可能属于支持向量的样本数据进行预选取,很大程度上减少了支持向量机的训练时间。本文应用了几种不同词汇量及信噪比的语音数据库进行了验证实验,实验取得了较好的结果,有效地提高了支持向量机分类器的学习效率和泛化性能。
其他文献
随着我国第三代移动通信商用网络的成熟和第四代移动通信试验网建设规模进一步扩大以及商用化进程的加快,如何提高移动通信网络的覆盖质量一直是移动通信运营商最关心的问题之
电气机电设备在机电产品中占据重要地位,但设备在实际安装与调试过程中时常有问题出现,这些问题的存在将会影响电气机电设备正常运行,严重情况下将会带来人员伤亡事故.因此,
施工现场管理在建筑工程管理中是不可或缺的重要组成部分,也是影响工程管理效率的主要因素.因此,建筑工程施工单位为了可以保证工程施工质量,在工程施工中需要高效完成施工现
“普通物理学”是应用物理学专业的一门必修课程,是自然科学和许多工程技术领域的基础.本文从教学原则、教学特点、所需条件、实践探索(注意问题)和教学效果等方面进行了实践
建筑工程管理是整个项目中非常重要的组成部分,其不仅是工程质量的保障,同时也是工程经济效益的保障.随着建筑行业的发展,人们对建筑工程管理的要求愈加严格,但是受到传统模