【摘 要】
:
聚类分析作为一种无监督的学习方法在模式识别、机器学习等领域得到了广泛的研究,并已成功应用于实际。随着网络的发展和信息收集技术的进步,实际应用的数据正变得越来越庞大和
【机 构】
:
厦门大学软件学院,厦门 361005
【出 处】
:
第七届中国Rough集与软计算、第一届中国Web智能、第一届中国粒计算联合会议(CRSSC-CWI-CGrC'2
论文部分内容阅读
聚类分析作为一种无监督的学习方法在模式识别、机器学习等领域得到了广泛的研究,并已成功应用于实际。随着网络的发展和信息收集技术的进步,实际应用的数据正变得越来越庞大和复杂,因此对聚类算法产生了新的需求,如何在大规模和带有噪声的数据集中有效发现任意形状的簇就是其中之-。基于划分的聚类算法,如经典的K-MEANS,倾向于发现数据集中具有超球形状的簇且无法识别噪声;基于密度的聚类算法DBSCAN等可以有效地识别具有任意形状的簇和噪声,且在使用数据索引技术后可达到O(nlogn)的时间复杂度,但对于大规模数据集创建和维护索引需要较大的时间和空间开销。层次型聚类算法CURE采用收缩后的多代表点表示一个簇,可以识别具有任意形状和密度不均匀的簇,但其时间复杂度达到O(n2logn)。基于网格的聚类算法CLiQUE等可以识别任意形状的簇,并且其时间复杂度通常较低,但这些算法的聚类质量与网格划分的尺度密切相关,而确定划分尺度并非一项容易的操作。本文结合CURE算法和网格算法的优点提出一种新的聚类算法ShrinClus。该算法利用簇内与簇间数据点的密度差异,使数据点往簇内移动,让簇内变得更紧密而簇间变得更分离,从而查找准确的簇边缘来确定簇。ShrinClus能发现任意形状并具有密度差异的簇,具有接近线性的计算复杂度。
其他文献
在美国底特律市北郊,一所不起眼的建筑物内放着液氮的容器中,正在经历着一场生死之战.这就是美国人体冷冻研究所存放冷冻人体的地方.
夜间作业包括不同的飞行任务范围,在应用夜视装备,如夜视镜方面需要更高的可靠性。未被察觉的夜视镜或视觉功能的任何降低,都能导致飞行安全和操作能力上的严重后果。在可控
50岁的刘德华,终于升级当爸! 5月11日,刘德华在官网发表一篇名为《一切安好》的留言,公开承认已经得女,第一句便是:“老大变了老爸了”。 老来得女,刘天王异常兴奋。据报道,46岁的朱丽倩进入医院后,刘德华便全程陪伴,当护士把女儿交给他时,他激动到热泪盈眶,一直看着女儿的俏脸。很显然,刘德华等这一天已经等得太久了。一届老天王,要啥有啥,高帅富到50岁,唯有生孩子一事,由于年龄较高,一再波折。可
近年来随着对相应的进化算法的基本理论、模拟进化方法与算法、与其它技术相结合的研究应用和实验验证,“进化计算”已经作为一个独立的学科被确立,并在实际运用中表现出很强的
二十年山水情寓情山水、回归自然,这是很多都市人梦想的生活方式。如果你问一个人是否热爱自然,几乎都会得到肯定的答复,但热爱到何种程度,恐怕就没有统一的答案了。对于洪凌
在对数据立方体和数据挖掘基本算法研究的基础上,笔者为广东省疾病控制中心研发了一个基于OLAP的、能为大规模疾病免疫预防数据提供决策分析的数据挖掘系统。系统实现了多种决
从6月1日公映的《醉后一夜》倒数到上一部问世的《万有引力》,我们已有一年多时间没在银幕上见到张静初了。之前,她是个高产的演员,一年动辄三四部作品。过去的这一年多里,她
聚类分析是数据挖掘领域的一项重要研究课题,聚类是将给定的样本集分组成相互分离的簇的过程。相同簇中的样本具有高的相似度,而不同的簇之间的样本具有高的相异度。相异度是根
Web挖掘的三个主要方向是:关联规则挖掘、序列分析和聚类分析。本文研究了对Web用户的聚类,使用的信息来源是Web日志(Web log),属于一种Web使用记录挖掘,然而不同于传统的Web使用
对高空减压病加压治疗的新经验及减压气泡检测方法的新成就进行了综述,并对下述几种情况的处理提出了相应的建议:高空上升时在空中未发病;空中发病、下降至地面时症状已消除以及下降至地面后发病的病例。对体表心前区多普勒超声气泡检测的假阳性与假阴性问题,以及视觉辅助系统与计算机辅助系统在提高检测方法的敏感性与特异性方面的作用进行了讨论。