基于密度与网格聚类算法的研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:tx9yky76
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,大量的数据爆炸性地产生,数据挖掘成为研究热点。在数据挖掘中,聚类分析是一种不可或缺的工具,日益成为一项重要的研究。  基于密度与网格的聚类算法是聚类分析中重要的研究方向,该算法即可以发现任意形状的簇,又能很好的处理高维数据,因此许多专家学者对其进行研究。本文提出了一种改进的基于密度与网格的聚类算法。  针对传统基于密度的网格聚类算法中存在人为设置密度阈值、固定的邻域半径、重复查询邻域内对象以及边界点处理不当等问题,提出了一种改进的基于密度与网格的聚类算法(improvement of clustering algorithm based on density and grid)。该算法首先将全部网格的平均密度值作为其密度阈值,避免了人为设置密度阈值的偏差;其次采用自适应算法确定邻域半径,使不同密度的数据采用不同的邻域半径,避免了全局使用一个邻域半径的缺点,使其能适用到动态的聚类中;然后采用对邻域外未标记的点作为下一个核心点,依据分类情况进行扩展,减少了邻域对象查询的重复问题;最后对边界点进行了处理,计算边界点到相邻的多个核心对象的距离,选取合适的核心对象,归入相应的簇中,提高了算法的聚类精度。  最后,对改进的算法进行实验,结果表明,改进的算法在时间效率及精度方面均有提高,并且能更好适应聚类的动态性。
其他文献
该文在对ME芯片的整体结构和工作流程进行分析的基础上,得出用FPGA实现ME芯片有很大优势的结论,接下来介绍了的FLEX10K的总体结构、边界扫描测试及配置.在此基础上,根据ME芯
该文的主要工作包括:剖析Mach操作系统,围绕Mach进程及其相关的核心数据结构讨论了进程迁移的机制和策略,进而构造Mach上的进程迁移服务器,最后,该文构造了用于测试的人工进
针对传统的代码注入和代码复用等攻击技术的缺陷,Return-Oriented Programming(ROP)提出了复用以ret结尾的短指令片段,实现图灵完备编程的思想。ROP攻击可以绕开现有的针对代码
随着信息技术的发展,人们对于运用计算机及网络技术来帮助、协调和管理自身工作的需求正在逐步地提高.近来,国内外兴起了一服办公自动化的热潮,希望能借助相关的计算机技术实
机器翻译是用计算机将一种自然语言翻译为另外一种自然语言的技术。由于具有良好的适应性,统计机器翻译成为现在主流的机器翻译方法。虽然统计机器翻译的模型在不断的发展变化
该文首先介绍了时态GIS的有关概念,提出了用MBC表示时空对象.然后概括了向种传统的时空数据存取方法,根据其处理MBC的方式可为四类:(1)排序;(2)变形;(3)分裂;和(4)重叠.
研究工作以作者在参与开发HMMIS(哈尔滨医药商业总公司信息管理系统)的基础上成功地开发"轻松98"商务软件为背景,分析了如何从原有的面向对象系统或非面向对象系统中提取构件
该论文分为六部分:绪论,8086CPU仿真支撑环境的总体设计,静态扫描,8086/8087主机的运行环境/机制的仿真,8086指令的仿真,仿真主机与I/O芯片之间的通信.通过一系列静态扫描步
该文首先简述实时系统的有关概念,特点以及实时应用的一般结构.接着以Intel公司的iRMX for Windows实时多任务操作系统为背景,通过深入分析该实时OS的层次结构及其内部的实时
该文提出了面向对象的多视图敏捷虚拟企业模型VEM.VEM由若干伙伴企业的局部模型与AVE的全局模型构成,按照面向对象的思想分别从工作流视图、组织视图、物理(资源)视图和信息