一种改进的谱聚类方法及其应用研究

来源 :河北科技大学 | 被引量 : 2次 | 上传用户:bidhq0716
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类社会的发展和进步,人们生活中的数据呈现出更多的复杂性、异构性。面对这些纷繁复杂的数据,分类分析往往是一类较为简单有效的方法。聚类分析便是一类广义的分类方法,它可以在某些条件下实现数据的自动分类,对数据进行筛选和处理,不仅让数据的规律性、可靠性大大增强,还可以提取出一些有价值的信息。  谱聚类方法是近年来出现的一类性能优越的聚类算法,能对互不交叉的任意形状数据进行聚类。原始的谱聚类算法可以很好的呈现出数据的本质特征,并将其归类。但在数据之间存在交叉的情形下,谱聚类方法的效果则不甚理想,主要原因是谱聚类算法在设定权值时所考虑的要素太过单一,容易导致算法稳定性较差,受到噪声或其他因素的影响。  针对谱聚类算法的这一缺陷,本文基于欧氏距离与测地线距离设计了一种改进的谱聚类算法,综合考虑数据点之间的距离特性和几何性质进行聚类。  首先介绍了聚类算法及谱聚类算法的基本概念和理论基础,分析了谱聚类算法中已有的研究成果及应用现状,然后总结得出谱聚类研究领域中的几个关键性问题。其次,本文重点分析了多重流形谱聚类算法与传统谱聚类算法的异同。在综合考虑两种方法优缺点的基础上,针对传统的谱聚类算法中相似度矩阵的构造问题,定义了一种新的距离度量,用欧氏距离与测地线距离构造新的结构权值,以此来构造新的权重矩阵,提出了一种改进的谱聚类算法。  最后对比分析了谱聚类算法、多重流形谱聚类算法,以及本文提出的改进算法这三种方法的聚类结果,并进行算法复杂度分析。结果表明:本文提出的改进算法可以处理存在交叉情形的样本数据点,性能更加完善,得到的聚类结果更加理想。
其他文献
[目的]萝卜细胞质雄性不育(OguCMS)是甘蓝型油菜杂种优势利用理想途径,但由于恢复基因仅存在于萝卜基因组难以直接利用,转育萝卜恢复基因是实现甘蓝型油菜OguCMS应用突破的关
我们形容身处美景中,常会说“如置身画卷一般”这画可以是水墨画,水粉画,油画;可以是工笔,可以是写意。总之,是将人代入纷繁多彩的世界里。有没有人想过置身于简单空旷的素描
针对基于状态控制的系统安全相关研究欠缺的问题,首先从访问控制的缺陷、状态控制的优势等方面讨论了研究的必要性和可行性;其次,通过引入粗粒度文件、程序及具动态特征的函
期刊
摘 要:天然气处理站是天津市甲级防火防爆单位,也是大港油田公司消防安全生产重点单位,储存着大量的易燃易爆物品――稳定轻烃和液化石油气。其中液化石油气属于甲类火灾危险性物质,常温高压下储存于压力容器中,火灾危险性极大,一旦泄漏极易引起火灾爆炸,造成人员伤亡和巨大财产损失。因此,对液化石油气储罐进行火灾风险分析,提出相应的危害预防及控制措施,对确保液化石油气储存过程的安全,预防重大事故的发生具有重要意
光纤干涉仪中的偏振态保持或控制技术是干涉型光纤传感器研究中极为重要的一个问题.特别当干涉光的两臂中的偏振态正交时,干涉仪输出的干涉信号为零,这时传感信号将完全消失.
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
一在宜良后街的花桥上不知有多少人做过梦,而兰罄和段老师做的梦是同一个——山茶花之梦。每到山茶花盛开的时候,我总会想起万家凹段大爷的那一园火红的山茶花,还会想起三年
近年来,偏序集与格论在拓扑学、组合数学、模糊数学、粗糙集理论以及理论计算机科学中都得到了广泛的应用,它们之间有着密切的联系。本文主要在偏序集与格论的基础上,研究拓扑空
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
为了提高无线传感器网络中基于接收信号强度指示(RSSI)方式的定位精度,分析了不同类别的经典定位方法,提出了基于能量的具有环境适应性的定位算法.在对ZigBee协议栈进行分析
期刊