论文部分内容阅读
支持向量机(support vector machine,简称SVM),是一种利用最优化方法解决机器学习的新工具。SVM由于具有较强的泛化能力和对高维数据操作方便而得到了日益广泛的研究和应用。基于监督学习的支持向量机,虽然可以有效地解决各种实际问题,但是为了获取足够的训练样本需要有经验的专家对大量无标记样本进行标记,这样会耗费大量的人力物力。同时,现实生活中存在着大量的无标记样本,如果不能充分利用这些资源,也是对现有资源的浪费。因此,根据需要研究人员提出了基于半监督学习的支持向量机,然而,半监督支持向量机是机器学习领域中相对比较新的理论,需要在监督支持向量机的基础上进一步地研究和改进。因此本文的研究工作主要包含以下两点:第一、研究了监督支持向量机的分类模型,针对传统的监督支持向量分类机的分类精确度不高和效率低下等问题,提出了两种新的分类模型,一种是贝塞尔光滑支持向量分类机,一种是基于圆切线的光滑支持向量分类机。并利用数学理论证明了这两个新模型的光滑性和收敛性,分析了其对正号函数的逼进性能,同时根据各自模型的特点,分别采用Armijo-Newton方法和BFGS方法进行求解,理论分析和数值实验结果都证明这两种新的光滑支持向量分类机在分类性能上优于以往提出来的光滑模型。第二、主要针对半监督支持向量分类优化模型中的非凸问题展开研究,通过对经典模型的研究,提出了一种新的半监督支持向量分类机----分段光滑的半监督支持向量分类机。在该模型中,基于分段逼近的思想提出了一个分段函数,并以此逼近非凸的目标函数。给出的分段函数可以根据不同的精度要求选择不同的逼近参数,同时基于模型的特点采用了低密度分离算法LDS(Low Density Separation)进行求解,并分析了其对对称铰链损失函数的逼进精度。理论分析和数值实验结果都证明分段光滑的半监督支持向量机的分类性能和效率优于以往提出的光滑模型。