【摘 要】
:
支持向量机是建立在统计学习理论的VC维理论和结构风险最小化原理的基础上,根据有限样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好推广能力的学习机。支持
论文部分内容阅读
支持向量机是建立在统计学习理论的VC维理论和结构风险最小化原理的基础上,根据有限样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好推广能力的学习机。支持向量机在解决小样本、非线性及高维模式识别问题中表现出良好的特性,在模式识别和机器学习领域得到了广泛的应用。支持向量机对分类问题的求解过程相当于解一个线性约束的二次规划问题,求解的变量个数与训练样本数相等,且需要计算和存储的核矩阵大小与训练样本数的平方相关。随着样本数目的增多,经典的求解二次规划问题的算法不再适用。目前,对大规模分类问题的支持向量机训练算法研究是支持向量机领域中的一个热点。
本文针对大规模二分类问题,基于数据分割和集成学习策略,提出了一种快速支持向量机学习算法。其主要思想是:首先对数据集进行预处理,自动将正负类分别聚成若干子簇;然后对两两组合的正负子簇用SMO算法进行交叉学习,得到多个基本分类器;最后对这些基本分类器进行集成学习。在UCI的5个数据集上的实验表明,与SMO学习算法相比,这种基于数据分割的训练策略在精度几乎没有损失的情况下显著地提高了训练速度。
其他文献
最近,湖北省纪委分两次通报了黄建设、刘有庆、张克禄、江忠兴、赵成霖、韩从银、陈玉国违纪违法案件的查处情况。黄建设等7人的所作所为,背离了党的宗旨,败坏了党和政府的形象,
本文分三个部分,第一部分:研究特殊形式的非线性微分方程的解的存在性问题。
复域上的微分方程理论是非常重要和非常有趣的,研究微分方程的方法也是多样的。Nevanlinna理
最优化理论是应用数学的一个分支,它在实际生活中的应用也非常广泛。20世纪30年代末40年代初最优化成为一门独立的学科,但是最优化的思想在微积分创立之初就已有体现。在最优化
细胞的研究在生物医学中具有重要的地位。细胞是生命体的基本构成和功能单位。细胞的生长、分裂和死亡模式维系着生命的存在,但也会导致生命的终结。单个细胞内部包含了完整的
本文主要讨论Zd(d≥1)上含有催化点的连续时间分支随机游动的若干问题,其中主要有:Zd(d≥1)上含有两个催化点的连续时间分支随机游动的灭绝概率(分别对d=1,2,d≥3进行讨论);一维非
供应链协调是供应链管理中的重要内容,研究供应链协调对降低供应链系统总成本具有重要意义。实际上,供应链运作过程中种种不确定性因素诸如突发事件的发生会导致供应链发生变化。因此,研究突发事件下的供应链协调具有更重要的实际意义。目前,已有一些学者研究突发事件下的供应链协调模型,然而,他们的讨论存在一定的局限性。本文在前人研究的基础上,综合运用契约理论、微分理论、博弈论等,采用理论分析和规范分析的方法,针对
网格计算是一种重要的新技术,网格环境中经常发生小规模组内的大块数据传输。多播技术是高效的传输方法,网格组通信将得益于多播技术。多播包括IP多播和应用层多播(ALM),二者各
本文的主体内容是从拓扑结构,基数和测度三个角度刻画分布混沌集的性状。特别的,构造了可数自密度量空间上的完全分布混沌的同胚,考查了在映射下不变的分布混沌集。最后从轨道逼
基于角色的访问控制RBAC是一种非常重要的已被广泛应用的访问控制模型,可以帮助企业或组织大大降低安全管理的复杂性和成本,适用于大规模的应用。但传统的RBAC模型还存在不少问