基于聚类分析的SVM分类算法

来源 :云南大学 | 被引量 : 0次 | 上传用户:rossh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SVM算法是建立在统计学习理论基础上的机器学习方法,该算法使用结构风险最小化原则替代经验风险最小化原则,克服了一些长期困扰其他模式识别方法的问题。SVM能较好地解决小样本、非线性、高维数和局部极小点等实际问题,对于比较复杂的非线性可分问题,SVM算法通过一个适当的非线性映射,将数据由原始特征空间映射到某个高维空间,使得数据在高维特征空间中近似线性可分,同时允许存在一定的误差,再用线性可分的方法在高维空间构造最优分类面。SVM使用核函数来替代样本在高维空间的点积运算,避免了维数灾难,降低了算法复杂度。由于SVM算法具有得天独厚的优势(完备的理论基础和较好的学习能力),使其成为当前模式识别领域研究的热点。   由于SVM算法在求解过程中需要求解二次规划问题,在处理非线性可分数据的时候,要计算和存储核矩阵,使得其在大规模数据集上的运行速度比较慢。为了提高SⅧ算法的运行速度,本文提出了一种基于聚类分析的SVM算法:在训练SVM分类器之前,可以先对训练样本进行聚类分析,得到若干簇,经过距离度量后保留比较靠近分类面的簇,丢弃别的簇,在尽量保留支持向量的前提下精简训练样本,用精简过的数据来训练SVM,提高SVM算法训练速度。实验结果表明,本文所提算法是可行的、有效的。
其他文献
用户界面是交互式软件系统中重要组成部分。它在应用软件中平均占开发量和运行时间的40%~50%[Myers1989]。界面设计工具可以用可视化的方法支持用户界面的快速设计、减少手动开
随着信息化的进展,以智慧城市为代表的新兴应用场景促进了新型协同计算模式的产生。其特征是计算向数据端靠拢,终端节点数目急剧增加且具有局部智能、物理环境及自身资源状态复
在知识全球化以及移动互联网普及的背景下,在线学习环境正以多样化的方式进入到学校教育和社会教育,在线课程数量及用户数量呈爆炸式增长。个性化学习强调以学习者为主体,并针对
WebGIS是GIS技术与Web技术集成的产物,它具有信息共享方便、访问范围广、扩展空间大、平衡高效的计算负载、维护及升级方便等特点,这使得在矿山信息化建设中充分利用GIS技术成
虚拟现实和网络技术已经极大地改变人类生活和工作方式。虚拟现实(Virtual Reality,简称VR)技术是二十世纪末才兴起的一门综合性信息技术,其本质是运用计算机对现实世界或者虚
无线传感器网络(Wireless Sensor Networks,简称WSNs)是由大量低成本、具有传感,数据处理和无线通信能力的传感器节点通过自组织方式形成的网络,目的是协作地采集、处理和传输网
随着互联网(Internet)规模的迅速扩展,以及日趋复杂化与商业化,越来越多的应用被迁移到IP网络上,如音视频交互、IPTV、网络游戏,它们对IP网络服务质量的需求也越来越强烈。然而,起
随着手机和网络的普及,第三代(3rd Generation)数字通信战略的发展和实施,游戏产业的日益发展,移动游戏的开发逐渐成为市场的一个热点。手机体闲娱乐应用的市场发展趋势已经逐渐
信息技术高速发展,人们对于计算机的依赖日益增强。软件作为人们与计算机硬件的交互工具,也在呈现爆发式的增长。软件测试作为保证软件质量和可靠性的重要手段,受到了人们的广泛
随着无线通信、电子与传感技术的发展,无线传感器网络引起了人们的广泛关注,它在国家安全、环境监测、交通管理、空间探索、灾难预防等领域具有重大的应用价值。传感器网络是由