基于群智能算法的聚类挖掘方法研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:puccacat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代来临,为了避免陷入“数据丰富,信息匮乏”的窘迫境地,数据挖掘担负着从海量数据中提取有价值的潜在信息并实现数据价值的重要使命。数据挖掘成为了众多学者在信息时代研究的热点之一。聚类是数据挖掘中的一个重要研究领域,它作为一种数据挖掘工具在诸多领域都有重要的应用。群智能算法是一种新兴的启发式优化算法,根据生物在生态系统中以存活、觅食、求偶等行为模拟而来。它具有自学习、分布性、自组织、并行性等特点,能很好地处理传统计算方法难以解决的一些复杂问题,特别是数据分析。群智能算法在处理一些复杂优化问题方面具备较大的发展潜力。本文详细论述了数据挖掘的基础知识和几种常见的群智能算法,分析了聚类算法存在的问题。论文对萤火虫算法的理论进行了研究和算法改进,并利用改进的算法来解决聚类问题。主要工作如下:(1)针对传统模糊C均值聚类算法初始聚类中心随机选取、容易陷入局部最优、效率低等问题,本文引入了混沌相关理论,提出了一种混沌初始化方法。然后利用Logistic映射修改萤火虫位置更新公式,得到较好的聚类效果。实验结果表明:该算法准确率较高,迭代次数较少。(2)针对传统模糊C均值聚类算法全局搜索能力较差、对初始聚类中心选择较敏感、聚类效果差等缺点,在上一个算法的基础上提出了一种新的小生境萤火虫模糊聚类算法。该算法首先采用了随机性和遍历性更好的立方映射初始化种群,然后引入随机惯性权重以修改萤火虫位置更新公式,以平衡探索和开发的性能。通过实验结果可知:该算法提高了聚类质量并具有较强鲁棒性。(3)针对k-means聚类算法聚类效果差、对初始聚类中心选择过分依赖、全局搜索能力较差等缺点,提出了一种引入莱维飞行机制的萤火虫划分聚类算法。该算法利用基于密度和最大最小距离法来初始化种群,并在萤火虫个体位置更新公式中引入莱维飞行机制,以避免陷入局部最优,同时使收敛速度更快,且具有良好的全局搜索能力,最后利用平衡方差评价函数优化目标函数。实验结果表明,该算法不仅避免了陷入局部最优,提高了k-means算法聚类结果质量,同时削弱了其对初始值的依赖程度。
其他文献
随着经济的发展,作为推销手段之一的广告越来越受到人们的重视。广告活动作为一种创作活动,其实际上是文化和艺术的结晶。任何民族文化均对广告创作有着重要的影响,而广告语
本文介绍了PLC、变频器在负压站恒压控制中的应用。结合生产实际,设计了一套基于PLC和变频器的恒压自动控制系统,使系统的自动化程度提高,压力稳定,运行可靠,降低了生产成本
<正>前言2014年的广东高考语文试题,语料形式丰富多样,内容贴近社会生活。阅读材料涉及人物传记、哲学审美、文学作品、名家访谈等,有助于多方面、多层次考查学生"知、情、意
为改变传统钢包运行维护管理中效率低下、出错率高的现状,基于工业物联网整体构架,将钢包运行维护管理系统分为感知层、网络传输层、智能层3层加以分析改进,并以某大型钢铁企
国际关系与国际法两个学科,在近半个世纪里不相往来,现在正重新关注对方。为落实“和谐世界”这一新的外交战略理念,为应对中国和平发展过程中出现的重大国际问题,两个学科的
全面核禁试条约(CTBT)于1996年9月10日在联合国大会获得通过,现已构建了健全的核查机制,放射性核素监测是获取违约事件确凿证据的主要手段,是国际监测系统中的重要组成部分,
当前讨论东北的振兴,是在中国市扬经济框架已经初步确立并进一步完善,对外开放程度已经相对较高的条件下展开的。在市场经济条件下,金融是现代经济发展的核心和基础,只有有了
<正>正当举国同悲,万民共哀沉痛悼念一代伟人邓小平,缅怀他伟大光辉业绩的时候,我们以同样悲痛的心情去重读、研究邓小平的著作、思想以寄托我们深深的哀思和怀念.近来邓小平
毛泽东从人与人的社会关系角度 ,着重研究人在社会中的地位和作用 ,从而形成其人民主体观。他的人民主体观主要表现在两方面 :一是人民是创造世界历史的动力 ;二是为人民服务
随着物质化经济的发展,人口数量的增加和农村人口向城镇的转移,住房等建筑项目越来越成为现代化发展的重要部分。而在进度管理是一个建筑项目工程里较为基础而重要的环节,一