一种基于样本点距离突变的聚类方法

来源 :南京大学学报(自然科学) | 被引量 : 0次 | 上传用户:haozhizhegogo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对聚类算法常见的难以确定参数、难以适应各种形状的数据集、在提高算法普适性时时间复杂度增大的问题,提出一种新的聚类算法:结合数据集全局和局部的特征寻找样本点距离的突变位置,通过计算样本点的簇内最小距离实现凸球型数据集的聚类;在此基础上提出子簇连结性强弱的概念,依据两个容易确定的参数进行子簇合并来适应各种形状的数据集.将该算法与DBSCAN (Density-Based Spatial Clustering of Applications with Noise)等多种聚类算法在四种经典数据集上比较,结果表明,该算法适用于类簇形状复杂的数据集,在同等聚类能力的算法中计算速度更快,且具有参数少、易确定的优点,在综合性能上表现优秀.
其他文献