结合粗糙集的支持向量机研究及应用

来源 :青岛大学 | 被引量 : 0次 | 上传用户:lqzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SVM是统计学习的一种,是在统计学习理论基础上发展起来的一种新型的学习机器。目前,SVM被看作是解决分类问题和回归问题的强有力的工具,并已经是机器学习领域继神经网络后新的研究热点。它以结构风险最小化原则以及VC维理论为理论基础,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的推广能力。支持向量机被看作是对传统分类器的一个好的发展,在解决小样本、非线性和高维的机器学习问题中表现出了许多特有的优势。众所周知,利用支持向量来进行线性或非线性规划具有全局收敛优势,但是支持向量机在解决多类问题时转化过程较为繁杂,且计算量较大,需要占用大量的训练时间。为此,提出了基于邻域的支持向量机训练算法,即通过邻域的计算来减少训练样本的数目以节约训练时间并降低计算量。为了在降低冗余的同时确保分类的准确率,在训练过程中也引入了粗糙集的原理,利用粗糙集理论对数据进行属性约简,从而进一步减少支持向量机求解计算量。实际结果证明了该方法的有效性。本论文解决的主要问题:(1)针对二类分类问题提出的支持向量机在解决多类分类问题时需要进行一定的转化,本文采用将一个多类问题统一为一个两类问题的转化方法,并在空间映射方面做出改进,使得新类的类内距离更小,类间距离更大,从而提高样本的可分性,最后通过类内散度和类间散度的计算在UCI数据集上加以验证。(2)结合粗糙集与支持向量机的理论,利用粗糙集理论对数据的属性进行约简,在保持知识库分类能力不变的条件下,根据其等价关系删除其中不相关或不重要的属性,从而简化决策表,在某种程度上减少支持向量机求解计算量及处理时间。最后将属性约简结合邻域概念以及支持向量回归机算法应用到电力系统负荷预测当中,并与传统算法进行对比分析来证明改进算法的优越性。
其他文献
随着快速增长的网络信息资源,人们很关切如何从互连网上找出对用户有价值的信息。搜索引擎解决了用户检索网络信息的难题,它是人们获取信息极为有效的工具。随着越来越深入的
伴随着信息技术的迅猛发展,使得各个领域的数据量激增,但是所能获得的有效信息却是有限的。如何在海量的数据中获取有价值的、潜在的信息,是当代人所面临的共同课题。数据挖
随着网络技术的发展和计算机应用的深入,分布式系统已经成为各个行业主流的软件系统。分布式系统具有诸多优点,但是在开发时面临诸多的挑战,这些挑战包括:如何使用户方便地访
网络在现在人们的日常生活中已经成为不可或缺的工具,通过网络寻找自己想要的信息资源已经变成人们获取信息最快捷和简便的方式,但是海量的网络资源对于用户来说是非常痛苦的
随着局域网和Internet的飞速发展,分布式通信技术已成为当今分布式计算领域的研究热点之一。分布式异步消息处理就是在分布式通信环境下,发送端发出请求消息后不必等待接收端
集装箱运输是现代物流业的主要方向,也同时是铁路货物运输的发展方向,在现有的铁路集装箱运输管理信息系统中,由于采用的追踪技术绝大部分是简单的一对一通信模式,无法在任意
虚拟植物是利用虚拟现实技术在计算机上模拟植物在三维空间中的生长发育过程,具有可视化的功能。虚拟植物根系研究是虚拟植物研究的重要组成部分,人们已经做了大量的工作,建
随着工作流技术的不断发展,开源工作流产品功能日趋完善,越来越多的软件企业和客户已经意识到,自己去研发一个工作流引擎或平台,已经毫无竞争优势和价值优势,甚至有可能是成
生态化污水处理技术作为一项污水资源再生的新兴技术,可以有效的实现生活污水的生态化、无害化处理,已经逐步成为近年来国内外污水处理领域研究的热点。本课题针对一体化MBR
真实感自然场景模拟技术一直以来都是计算机图形学领域的热点研究问题,而真实感草地场景模拟技术则是其中一个重要的组成部分。本文在总结国内外研究成果的基础上,研究并实现