基于SOM和PSO的聚类算法研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:dande
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于自组织映射(Self-Organizing Feature Maps, SOM)算法和粒子群优化(Particle Swarming Optimizing, PSO)算法拥有着概念简明、实现方便、收敛速度快、参数设置少,自组织自适应的特点,使得二者近年来在聚类分析领域越来越受到人们的广泛关注。但是,这两种算法的初始化都是选择随机的方式,这就导致了算法的收敛速度受到影响,聚类的精确度也有待于进一步提高的问题。本文通过对现有一些SOM和PSO的改进算法进行研究,提出了三种改进方案:一是提出了用局部样本中心初始化神经元权值的方法,改进了SOM算法;二是将收缩因子和淘汰最差粒子的策略应用到PSO聚类算法之中,改进了PSO聚类算法;三是将SOM算法与改进的PSO算法进行有机结合,提出了SOM/PSO聚类组合算法。第1章介绍课题的研究意义和研究现状,并对全文的研究内容做了概述。第2章介绍了SOM算法的原理和机制,针对SOM算法随机初始化神经元权值的策略影响了算法的收敛速度,以及对比文献中SOM改进算法无法处理噪声等问题,提出了一种用局部样本中心初始化神经元权值的改进算法——LCSOM算法。通过对UCI测试集的聚类实验验证了该方法能够提高SOM算法收敛的速度,弱化噪声对权值初始化的影响。第3章介绍了群体智能和粒子群优化算法的概念,并针对粒子群优化算法无法保证收敛和收敛速度慢等问题,引入收缩因子到PSO聚类算法中——得到SF-PSO算法,还提出了在此基础上引入淘汰最差粒子策略的SFAW-PSO算法。对UCI测试集的聚类实验验证了SF-PSO算法和SFAW-PSO算法能够在确保PSO聚类算法收敛的基础上,加快算法的收敛速度,并用外部和相对评价方法分别对聚类结果进行评价,获得较好聚类的质量。第4章为解决PSO聚类算法收敛速度慢的问题,提出一种将二者有机结合在一起的聚类组合算法SOM/PSO算法。按照PSO聚类算法选取的不同,组合算法可以细化为SOM/PSO算法、SOM/SF-PSO算法和SOM/SFAW-P-SO算法。经过对UCI测试集的聚类实验验证,三种新的聚类组合算法能够在不影响聚类效果的前提下,提高算法收敛速度和聚类的质量。第5章通过对文本数据集进行聚类实验,检验了LCSOM算法和SOM/SFAW-PSO算法对文本数据的聚类效果:在聚类效果不变或更优的情况下LCSOM算法比SOM算法在速度上有较大的提高,而SOM/SFAW-PSO算法比对比文献中的组合算法在聚类效果上有所提高。
其他文献
近年来,随着计算机技术、网络技术与无线通信技术的高速发展和广泛应用,无线传感器网络成为一个在国际上备受关注的前沿热点领域,被评为未来高科技的三大产业之一,它在军事、环境
应急预案流程是突发事件应急管理中重要组成部分,描述了在发生突发事件情形下怎么配置各种资源从而减少损失的规则集合,它直接决定突发事件所造成灾难的范围及程度。虽然我国
WSMO来源于WSMF,是当今最流行的语义Web服务描述框架之一,其目的在于增强Web服务描述的语义性,使Web服务成为计算机可以理解的实体。中介器是WSMO的四个顶层要素之一,用于解
随着嵌入式应用的复杂性的提高和对实时性要求越来越苛刻,作为其核心的嵌入式实时操作系统就显得尤为重要。现有的大部分嵌入式RTOS一开始的设计就着眼于系统的实时性,其应用
煤炭开采业作为高危行业,煤矿安全事故时有发生,威胁着矿工的人身安全,同时给企业也带来了巨大的经济损失。煤矿安全监控和通信系统作为提高煤矿生产安全的有效途径和手段,在
摘要:随着我国铁路跨越式大发展,铁路运输装备从传统的机车车辆向动车组转变,对车地通信的实时性和准确性都提出了更高的要求。利用计算机仿真的手段,来模拟动车组的实际运行
随着管理信息系统(Management Information System, MIS)的不断变化和规模的日益扩大,如何有效地控制系统的开发周期,开发成本以及软件质量,成为了开发过程中亟待解决的问题
随着信息化大潮的来临,网络攻击技术呈现出多样化,黑客攻击客户端已成为威胁计算机安全的最大隐患。目前计算机信息的安全问题很难单靠软件的方法解决,为此可信计算平台联盟T
随着Web2.0时代的到来,互联网的迅速发展,人们对网络的依赖越来越多。尤其是“互联网+”的提出,各大企业均响应号召,实施转型,各行各业每天都能产生海量数据,且呈爆炸式增长
随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从巨量、复杂的数据中获取有用的信息,使数据挖掘技术成为了近年来信息技术研究领域的热点问题。数据挖掘是一种包