粒度支持向量机学习方法研究

来源 :山西大学 | 被引量 : 4次 | 上传用户:as7770420
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machine,SVM)是近年来受到广泛关注的一类学习机器,它以统计学习理论(Statistical Learning Theory,SLT)为基础,具有简洁的数学形式、标准快捷的训练方法和良好的泛化性能,已广泛应用于模式识别、函数估计和时间序列预测等数据挖掘问题。然而,由于支持向量机的学习效率主要取决于数据的规模,迄今为止,针对实际问题中的大规模数据集,支持向量机并未达到人们期待的处理效率。因此如何提高支持向量机的学习效率就成为支持向量机研究所关注的焦点,这也是本文研究的出发点。本文将粒度计算方法与支持向量机相融合,对粒度支持向量机(Granular SupportVector Machine,GSVM)的学习机制和学习算法进行系统的研究,主要内容如下:(1)对现有的支持向量机与粒度计算具体模型的结合方法进行了系统的分析。(2)探索了粒度支持向量机的内在学习机制,在SVM学习框架下,引入粒与粒的内积运算,建立粒度核函数并将之运用于粒度支持向量机的学习之中。首先按样本标签将数据集分为多个粒,然后将每个粒看作参与SVM的训练。通过控制粒的多少从而控制粒的粗细进行训练,最终可以在训练速度和泛化性能之间找到满意的折衷。实验表明,运用粒度核支持向量机可以使训练速度大大提高,同时可获得令人满意的泛化能力。(3)提出了一种基于指数相似度的粒度支持向量机学习方法。针对粒度计算在大规模数据集处理方面的应用,本文引入指数相似度作为划分粒度层次的工具,对数据集建立粒的层次结构,并在不同的粒层次之对进行训练,最终找到合适的粒度范围,并在训练速度和泛化性之间获得满意的折衷。本文研究的内容是SVM研究中的热点问题之一,SVM与粒度计算理论相结合也是新的有益的尝试,研究结果不仅对拓展SVM的学习理论具有重要的理论意义,而且对于实际问题具有直接的应用价值。
其他文献
数据挖掘是近年来迅速发展的信息处理技术。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息
在中文信息语言处理领域里,以大规模真实文本为基础的语料库研究和知识自动获取越来越受到重视,建设大规模高质量的语料库成为首要的任务。然而由于现阶段语料库的建立,需要