基于粒子群和粗糙集的聚类算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:kuaijizhidu2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘就是从海量数据中提取具有潜在价值的信息,是目前信息管理领域和数据库技术最前沿的研究方向之一。聚类分析作为数据挖掘技术中的重要组成部分,已经广泛应用于模式识别、图像处理、数据压缩及市场营销等许多领域。本文深入探讨了K-medoids聚类算法、粒子群算法、核函数以及粗糙集理论,主要研究工作如下:(1)针对K-medoids算法存在初始聚类中心敏感、聚类精度较低及收敛速度缓慢的缺点,提出一种基于密度初始化、密度迭代的搜索策略和准则函数优化的方法。实验表明,该算法能充分利用密度初始化思想,并将中心点的候选范围缩小使得聚类收敛时间大幅度减少,加权准则函数进一步保证了聚类的高效性。(2)深入分析K-medoids算法还存在易陷入局部最优的缺点,提出一种基于粒子群的聚类算法。通过寻找粒子群和K-medoids算法的契合度,利用粒子群的全局寻优能力防止算法陷入局部最优。实验表明,与其他算法相比,该算法具有更高的正确率,时间复杂度更低,综合性能更稳定。(3)提出一种基于粒子群的粗糙核聚类算法,该算法将K-medoids和粗糙集、核函数及粒子群算法进行有效结合,克服了K-medoids不能处理非线性数据和边界对象的缺点。该算法通过Mercer核将样本映射到高维空间,使样本变得线性可分;并结合粗糙集思想,对边界对象进行处理;同时采用ReliefF方法对样本属性进行加权处理,最后利用粒子群算法防止算法陷入局部最优。实验证明,该算法能对高维线性不可分数据具有较好的聚类效果,并证明了算法的正确性和高效性。
其他文献
在智能交通系统的研究中,交通流状态估计和交通流预测是实现智能交通管理与控制系统、旅行者信息服务系统等子系统的关键技术,也一直是国内外研究的热点。与城际高速公路和城市
随着现代信息技术的发展,数字信息以前所未有的增长速度和规模被源源不断的生产出来。数字信息增长速度惊人,来源广泛,种类繁多,数量巨大,已经成为使用最多最频繁的信息资源。档案
“回绕测试法”和“穿越测试法”被ISO/IEC IS9646定为测试OSI中继/中间系统的两种标准测试方法。随着网络技术的发展,网元设备的路径表、交换表的容纳能力以及输入/输出端口对
数字图像巨大的数据量给其传输和存储带来了不便。基于图像自相似特征的分形图像压缩方法具有高压缩比、分辨率无关性和快速解码等特点,受到国内外许多研究者的关注。但现有的
互联网上的信息呈爆炸性的增长,随着资源数字化速度的增快,社会随即进入大数据时代,如何实现数据资源的电子共享是当今研究的热点。人们很清楚数字信息就是资源数字化的数据表示
路面破损检测是高速公路养护与管理的重要工作,依靠传统手工检测路面破损程度的方法已不能满足道路养护与管理工作的快速发展需求,随着光电技术及计算机技术的高速发展与普及,基
随着B/S架构的出现,大大程度上降低了信息管理系统的开发难度,也使用户感到系统应用的方便和快捷,促进了MIS系统的发展和应用。如何实现基于B/S架构系统的可变信息标签动态打印
数字图像作为信息传递的一种有利载体,通过其信息量大和形象逼真等特点,广泛存在于各种网络环境及现实生活中。但是各种高级图像处理算法以及相应图像处理软硬件的出现,使得
一致性问题是移动白组网的基础性问题,利用不可靠故障检测器解决一致性问题有很多的方案,按照适用范围可以分为具体协议和通用协议。这两种协议具有不同的特性,各有优缺点。
学位