论文部分内容阅读
支持向量机(Support Vector Machine,SVM)作为一种优良的机器学习算法,已被人们大量应用于工业生产、生活应用当中。但是,SVM存在着不能处理带有模糊信息、以及对噪声敏感的特性,因此学者们期望通过引入模糊支持向量机(Fuzzy Support Vector Machine,FSVM)来解决以上问题。FSVM对SVM的改进是通过对样本数据集特性的分析得到隶属度函数(Membership Function,MBSF),通过MBSF为每个样本赋予隶属度(Membership,MBS)。因此FSVM算法的核心在于如何构造良好的MBSF。根据MBSF构造的不同学者们提出大体可分为两类FSVM模型:基于样本和和类中心距离(Distance between Sample and Class Center,DSC)设计 MBSF 的 FSVM 和基于样本和类中心超平面距离(Distance Between Sample and Class Center Hyperplane,DSCH)设计 MBSF的FSVM。基于DSC设计MlBS的FSVM作为最先提出的算法以其简单易于操作的特点而被大量应用,但是这样设计MBSF难免会导致支持向量的MBS大小不一从而影响分类精度。基于DSCH设计MBS的FSVM算法虽然能有一定程度上解决以上问题,但是,基于DSCH的算法由于需要计算得到DSCH因而其时间复杂度相对较高而且这样强制的使用DSCH来反映MBS算法普适性较差。在分析学者们提出的一些基于两类传统FSVM模型的改进算法后,本文通过对潜在支持向量样本(Potential Support Vector Samples,PSVS)进行分析后引入调整因子,使得类中心沿着靠近分类超平面方向调整。这样在使用调整后的类中心的基础上使用传统的两类FSVM模型得到本文的两类自调整FSVM算法。这样得到的改进算法可以综合两类传统模型的优点,而且不会带来较大的时间开销。同时本文同时对传统的FSVM实验部分进行了改进:本文通过综合核参数和惩罚系数两个变量,以主要变量核参数作为自变量,以对次要变量惩罚系数得到的分类准确率的平均值作为因变量,通过二维曲线的变化来比较算法间的差异,这样,得到的实验结果更令人信服。在实验部分,本文通过对两类改进模型进行实验分析得到其对应的最佳偏移比例系数,在此基础上对本文提出的两类改进FSVM算法和SVM以及其他FSVM算法在分类精度和分类时间上对比。实验表明本文提出的两类自调整模糊支持向量在保证时间复杂度适当的条件下算法稳定性和分类精度上均得到了一定的优化。同时对实验结果进行分析后得到对两类改进模型的各自使用场景。图27表5参58