模糊聚类算法及其聚类有效性的研究

来源 :青岛理工大学 | 被引量 : 0次 | 上传用户:cboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着数据挖掘的发展,对聚类的研究越来越深入。目前存在很多种聚类方法,其中模糊C-均值聚类算法应用最广泛,基于该算法提出了很多改进的算法以达到更好的聚类效果。对于聚类后的效果,需要聚类有效性指标进行评价。针对模糊C-均值聚类算法和聚类有效性指标的研究现状,本文在以下方面进行了改进:(1)针对模糊C-均值聚类算法提出了属性加权的思想。由于数据集中不同的属性对聚类的影响是不同的,因此有必要对属性赋予不同的权重。基于属性加权的思想,本文得到了新的模糊C-均值算法的目标函数、聚类中心和隶属度函数的迭代公式,并通过实验对改进后的聚类进行验证。(2)提出两种新的聚类有效性指标。由于聚类问题的多样性,没有统一的聚类有效性指标衡量所有的聚类结果,只能从不同的聚类有效性指标分别进行改进。本文提出了两种聚类有效性指标,第一种:基于N.Zahid指标,通过改进该指标中的模糊类间分离度和类内紧密度,形成新的聚类有效性指标;第二种:结合Vxie指标、Vbsaid指标和Vkwon指标,并引入新的惩罚因子得到新的有效性指标。对于这两种新指标均通过仿真实验得到验证,其稳定性、判决性及鲁棒性良好。
其他文献
随着信息时代的到来和多媒体技术的飞速发展,多媒体因其丰富形象的表现形式,已经成为信息数据的重要载体之一。在视频信息的大量涌现和迅猛发展的情况下,如何快速有效地处理
目前增强现实系统的应用越发广泛。在增强现实系统中,相机跟踪、虚实融合和人机交互是三大核心问题。当用户使用增强现实系统时,徒手交互是最自然的交互方式之一。然而当前手
1859年11月24日,英国生物学家Charles Robert Darwin发表了《物种起源》一书,提出了生物进化论学说。科学家们发现可以通过进化树来形象的展现物种之间所存在的遗传系谱关系
业务流程模型是一种反映业务流程执行过程的计算机化的模型,是为了能在先进计算机环境支持下实现运营过程集成与运营过程自动化而建立的、可由业务流程管理系统执行的业务模
目前,柑橘产量排在重庆所有种类水果中的第一位。要维护广大柑橘农户的利益,其关键就是提高柑橘的产量和品质。柑橘生长发育的基础是水分,柑橘园水分管理的好坏直接影响到柑
XML是W3C于1998年提出的一种标记语言,由于独特的技术优势,XML推出后很快就成为Internet上信息描述和交换的标准。随着XML应用的越来越广泛,Web上的XML文档与日俱增,为了实现
目前有很多针对正常与非正常案例甄别方面的研究,大多是研究如何人工建立区分标准或特征库,这类方法不仅使得前期准备工作量巨大,而且后期甄别能力有限,准确率也低,在很多应
Web服务因其强大的集成能力而受到广泛重视。单个Web服务提供的功能通常是有限的,因此实际应用中需要对网络上分布的Web服务进行组合以满足用户需求,这种组合的方法为Web服务测
随着计算机技术、通信技术和半导体技术的快速发展,物联网成为新一代信息技术的重要组成部分。作为物联网中的一个重要组成部分,无线传感器网络应用也越来越广泛,相关研究也
三维人脸重建在人脸识别、影视制作、网络游戏以及医学等方面中的应用越来越广泛,并且随着计算机技术的快速发展,三维人脸重建已经成为当今计算机图形学、计算机视觉以及模式