支持向量机的在线学习算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:duyuh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由Vapnik等人建立的统计学习理论(Statistics Learning Theory,SLT),是一种小样本的机器学习理论,为机器学习问题提供了统一的框架。通过对学习一致收敛问题的讨论,SLT给出了学习机器推广能力的界,进而给出了不同于传统学习中经验风险最小化准则(Empirical Risk Minimization,ERM)的结构风险最小化准则(Structure Risk Minimization,SRM),并在此基础上给出了一种新的学习算法支持向量机(Support Vector Machine,SVM)。SVM基于SLT坚实、严谨的理论基础,比传统机器学习方法具有较好的学习性能和泛化能力。 在实际应用中,很多情况下我们并不是一次就可以拿到所有样本,需要学习的样本是分批到达的,这就是说原来学习好的分类器由于新增样本的到来而需要重新学习,也就是增量式学习。目前,很多优秀的算法应用在大规模样本的SVM训练中有着良好的表现,但它们并不能直接支持增量式学习。另一方面,经过多次的增量学习,历史样本集的数目越来越大,造成增量学习的时间过长和存储样本的空间过大。因此,我们必须将一些对分类没有影响或者影响小的样本淘汰掉,这就是在线学习。我们通过对样本在高维特征空间上的位置不同而造成对分类影响作用不同的特点分析,发现在加入数量不大(相对已有样本)的新样本时,样本对新分类器的影响主要由两个因素(样本到该类样本集的中心距离和样本到最优超平面的距离)决定。由于对大规模样本的训练,一般要采用分解算法,我们保留了原来的支持向量的拉格朗日乘子的优化值作为分解迭代的初始值,让初始值离优化值的距离靠近从而减少迭代次数,从而减少增量学习的时间。 本文通过上述分析,提出了一种基于β因子的历史样本淘汰制度的在线学习算法。通过对LICI标准数据测试集中的若干个测试样本集进行测试,并对测试所得的结果进行分析。结果表明:β因子的历史样本淘汰制度能有效地除去样本集中对分类无关的样本,在保持了分类精度和泛化能力的情况下,大大缩短了增量学习的训练时间。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
本文共分两大部分,分别在半直线和Rd上,对一般的二阶椭圆算子建立了弱Poincaré不等式.在第一部分中,使用加权Hardy不等式来估计第一Neumann特征值,并用以建立弱Poincaré不等式,
本文首先在后代律和移民律满足一定假设条件下证明了一列带移民GaltonWatson分支过程的高密度波动极限是一个Ornstein-Uhlenbeck型过程. 然后给出了几个在我们的弱收敛定
传统体育教学模式俗称为“三步走”,即准备环节(队列队形和准备活动)、训练环节(主教材的教与练)、结束部分(放松整理活动).这种教学模式单纯强调了以教师为主导的作用,忽视
本文着眼于中国美术学院提出的“三美”育人理想,结合笔者的工作实践,阐释中国美术学院独具特色的育人工作.
本论文研究了两类具有一定的生物背景或实际意义的泛函微分方程的周期解存在性及其相关问题,并得到了一系列新的结果。 本论文的结构如下。第一章,应用重合度论中的延拓定理
在工程实际问题中,存在着大量由随机突变现象引起系统跳变的动力学系统,比如系统元件失效或修复、子系统互联变化、外界突变扰动、环境条件等的突变、非线性系统经线性化后工作
本文基于著名的Sprott混沌系统中的C系统和F系统,研究了以下两类三维自治系统的动力学性质和混沌运动(ⅰ){x=yx和(ⅱ){x=y+zy=ax-yy=ax+byz=1-x2z=x2-z其中系统(ⅰ)当a=1时对
机器人技术是汇集了当今世界在计算机、机电、材料、传感器、控制技术等多个学科领域的尖端技术,尤其是双足步行机器人,因其具有类人的外形和步行方式及其广泛的社会应用前景和
图卷积神经网络是一种基于不规则或非欧几里得数据进行预测和分析的模型。数据科学如今发展迅速,图卷积神经网络在各行各业都有很多应用。本文的主要内容可分为两部分:1.本文提出了一种新的图卷积神经网络解决网络表示学习中的节点分类问题。它建立在一个基于深度的图结构表示上,我们称之为基于深度的子图卷积神经网络(DSCNN,short for Depth-based Subgraph Convolutional
学位