一种改进的遗传算法在K-Means聚类分析中的应用

来源 :华北电力大学 | 被引量 : 0次 | 上传用户:liongliong448
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一般我们在处理某些特殊事情的时候,往往需要借助工具,将事物分类之后再进行研究,比如地质资源勘探中根据物探、钻探的指标对样本进行分类;考古生物学研究中根据发掘出的骨骸形状和大小将它们分类;气象卫星系统中因为所监测到数据信息非常复杂、庞大,需要将它们按照不同的指标进行分类归整,再进行深入分析,以便做出准确的预报等等,聚类分析因此应运而生。聚类分析技术是一门将具体或抽象的对象划分成不同的类别的科学,其中并没有事先的分类。它也是一种重要的人类行为。随着计算机和信息技术的快速发展,数据信息呈现飞速增长的趋势,作为数据挖掘技术的一种重要手段,聚类分析已经被越来越多的人所关注。K-Means算法是一种基于划分的算法,由于其操作简单,原理通俗易懂的特点,得到了人们的广泛应用和研究,成为十大典型数据挖掘算法之一。但是K-Means算法也有自身的不足,即k值不好确定的问题,初始中心只能随机选择,容易陷入局部最优解等,导致算法很不稳定。因此,本文在K-Means聚类算法基础上引入遗传算法,它是一种通过模仿生物演化过程而开发的进行搜索最优解的方法,具有良好的全局搜索能力。针对两种算法的特点,提出一种改进遗传算法应用于K-Means聚类的混合算法,并用样本数据集进行了仿真实验,实验表明本文算法在应用中得到了良好的聚类效果。本文的工作主要分为两部分:1)第一部分主要简单介绍了聚类分析、K-Means算法和遗传算法的基本概念。重点概述了K-Means算法和遗传算法的基本思想,描述了算法的组成和基本要素以及流程,最后介绍了算法的应用。2)第二部分重点介绍了一种改进的基于遗传算法的K-Means聚类算法,并对此算法在染色体编码、适应度函数的选取、选择、交叉和变异算子的设计和改进、K-Means算法与遗传算法的结合操作等方面进行了全面描述。最后,为了验证本文提出的算法的有效性进行了测试实验,根据实验结果对两种方法进行对比分析,证实了本文方法的可行性和良好的聚类性能。
其他文献
化工产业是我国的支柱产业,其发展一定程度上推动了国家经济的发展,因此化工建设项目也是社会各界关注的重点。H化工建设项目是石化项目的一套重要生产装置,工况复杂,技术性
本文主要研究了初中男女生物理实验操作能力及品质的比较。经研究得出初中男生的实验操作能力比女生要好,但女生的发展程度要好于男生。
自我国2001年加入WTO以来,外资企业在中国的投资额和设立分支机构的数量一直保持有增无减的态势。而近年来,进入中国市场的外资企业中,小微企业的占比不断提升。这些小微企业
基于集体土地所有权与土地承包经营权两权分离下所导致的农地细碎化经营、难以实现农地融资功能等弊端,2019年1月1日实施了新修订的《农村土地承包法》,将土地经营权界定为一项由土地承包经营权人所设立的法定权利,从法律层面上确立了农地权利的分置。其分置的内涵在于落实集体土地所有权、稳定土地承包经营权、放活土地经营权,而要实现新型农业经营体系、土地规模化经营的目标关键在于如何放活土地经营权。本文首先从三权
开发高效、稳定的光催化剂是光催化技术发展的核心问题。近年来,众多的半导体光催化剂已被开发利用,但是太阳能利用不足和量子效率低等问题限制了光催化剂的实际应用。将两种
通过理论分析与实证研究,采用定量和定性分析相结合的方法,对成果导向体育课程设计进行研究。研究表明,与传统的重视学科内容课程发展方式相比,成果导向体育课程是重视学生体
自1998年我国住房货币化政策实施以来,房地产业进入了快速发展轨道,逐渐体现出其在促进经济增长中的支柱地位。但随着2008年全球金融危机的冲击以及中国经济进入新常态的大势所趋,房地产业高速发展下的隐藏弊端也日益凸显,高房价不仅降低了居民生活的幸福指数,同时在一定程度上加剧了产业空心化困境。在此背景下,厘清房价高企与制造业结构优化的内在联系,破解房地产业挤压制造业生存和发展空间是当前热点课题。本文基
降水径流是导致坡地氮素、磷素流失的重要因素,而氮磷流失是导致水源地上游非点源污染的重要原因,因此,对于水库上游水源林地表径流(SR)和壤中流(SSR)及其氮磷流失规律的研究备受关注。本文以鲁中南山区泰安市黄前水库上游药乡小流域为研究区域,以该流域典型树种赤松林(PDF)以及荒草地(对照)为研究对象,通过人工模拟次降雨产流试验方法,对赤松林地地表径流和壤中流及其氮磷流失特征进行研究,探讨次降雨条件下
旅行商问题作为组合优化问题的典型代表,很多问题都可以转化为该问题求解。随着优化理论在各行各业的广泛应用,寻找旅行商问题的最优解成为研究重点。论文以求解旅行商问题的
目的:探讨父母教养方式、隐性自恋与青少年网络欺负之间的关系及内在作用机制。方法:使用父母教养方式问卷、自恋人格问卷和网络欺负问卷对773名中学生进行施测。结果:1父母