基于子空间学习的多视图谱聚类算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wenzhen881219
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代,数据呈爆炸式增长,其中大多数为无标签数据,因而对数据进行无监督学习的聚类分析技术越来越重要。目前机器学习算法主要是在单一视图表示的数据上运行的,这种方式实际上与人类的从多个角度全面地分析问题的方式相背。与单视图聚类相对的是多视图聚类,它在多个特征来源的数据集上运行聚类算法,能够利用视图之间的互补性,提高原本单视图上的聚类效果。子空间学习与谱聚类是目前最广泛的被应用于多视图聚类领域的算法。然而,现有的基于子空间学习的多视图谱聚类算法普遍基于低秩或稀疏的先验,且大多数多视图聚类算法都忽略了原始数据样本间的关系,使得捕捉到的聚类结构不够准确;另外,传统谱聚类算法中独立的聚类标签求解步骤往往会导致次优解。针对以上问题,为了进一步提升多视图聚类效果,本文分别以聚类结构挖掘和聚类标签学习为侧重点,提出了两个多视图聚类模型,主要工作如下:第一个模型是基于一致性相似度学习的多视图子空间聚类算法(CSL)。该模型基于子空间学习,从高维数据中通过自表达模型和原始数据的相似图结构来学习更利于聚类任务的低维子空间表示,继而在拉普拉斯秩约束的条件下从每个视图新的特征表示中学习具有更理想块对角结构的一致性相似度矩阵,以便在后续谱聚类中进行更准确的图割。在第一个模型的基础上,本文进而提出了基于子空间学习和谱旋转的一体化多视图聚类算法(UMSSC),将拉普拉斯矩阵融合以更敏锐地捕捉不同视图之间的差异,并利用谱旋转理论替代谱聚类的k-means步骤以便在一个一体化框架内可以直接求得离散的聚类标签,且由于各变量在一个统一过程中优化,变量之间相互反馈指导,得到的聚类结果更接近真实的聚类标签。综上,本文的主要工作成果是:(1)分析多视图聚类问题的关键点,针对基于子空间学习的多视图谱聚类算法目前的缺陷提出相应的改进,以合理的视图融合策略分别以聚类结构挖掘和聚类标签学习为侧重点提出了两个模型CSL和UMSSC;(2)提出了两个模型对应的优化算法,详细地阐述了求解步骤,并对算法进行了收敛性和复杂度分析及实验评估;(3)将模型CSL和UMSSC与12个优秀的方法在6个真实世界基准数据集上进行对比,并分别对两个模型的参数进行了分析,另外针对本文创新点进行了消融实验。实验证明,本文两个模型都能有效提高聚类效果,且适用于多种多视图数据场景。
其他文献
随着劳动力市场的不断发展,知识经济的到来,员工职业生涯发展的背景发生了巨大的改变,雇佣关系的稳定性遭到前所未有的打击,自此,无边界职业生涯时代正式被提出,指员工超越组织边界选择就业的机会。无边界职业生涯时代的员工和组织呈现出不同以往的特点,组织扁平化、灵活化趋势显著,员工工作环境的动荡使其产生不安全感。环境变化引起了员工心理层面的变化,员工由追求终身雇佣转变为追求终身可雇佣性。可雇佣性这一概念最早
为了改善重型商用车辆平顺性与道路友好性,开发了一种带有节流阀的横向互联空气悬架系统。横向互联空气悬架通过在车轴两侧空气弹簧中交换气体,可以减小车身振动和轮胎对地面的载荷。本文建立了带有横向互联空气悬架的车辆模型和四轮路面激励模型,探究了横向互联空气悬架对车辆平顺性与道路友好性的影响,最后对横向互联空气悬架的参数进行了优化分析。具体的研究工作如下:(1)针对横向互联空气弹簧的结构,分为空气弹簧气囊腔
创面细菌感染是导致人类发病率和死亡率增加的重要原因之一。抗生素药物常用于抗菌治疗,但由于长期使用极易引起细菌耐药性甚至产生超级细菌,具有巨大的潜在风险。降低抗生素使用以及寻找合适可替代抗生素治疗的抗菌材料具有重要的意义。NH2-Fe-MIL-88B(Fe-MOF)是具有大比表面积、含有丰富且易于修饰的官能团以及具有类似过氧化物酶(POD)活性的金属有机框架纳米酶,Fe-MOF可通过Fenton机制
锰是我国工业生产所必需的重要原料之一,一般通过电解法制备。电解锰渣是电解金属锰工艺的副产品,含有超量的锰、氨,以及其他有害重金属元素。电解锰渣通常采取筑坝堆存处置,这有可能对周边生态环境带来潜在的污染风险。本文以贵州铜仁某电解锰渣库的电解锰渣为研究对象,采集了电解锰渣库区的电解锰渣样品,分析了电解锰渣的酸碱度、粒径分布、含水率、物相组成、形貌、化学组成等基本理化性质;并对电解锰渣进行浸出毒性实验,
光伏发电是一种高效利用太阳能的方式,具有良好的发展前景。近海滩涂因阳光充足、遮挡较少,是建设光伏发电站的优质区域。但是,近海滩涂常为深厚软土地基,地基处理难度大,陆地的桩基础往往难以适用,而常采用一种表面置于滩面的筒型基础。为了增强近海复杂环境荷载作用下的滩涂基础的稳定性,近年来发展出一种新型的筒型基础——嵌入式筒型基础。此种基础由于完全嵌入土内一定的深度,其受力失稳模式与承载特性尚不很明晰,缺乏
送粉喷头是实现定向能量沉积技术(Directed Energy Deposition,DED)的重要零部件之一,送粉喷头的结构决定了粉末流的汇聚效果,影响沉积层的尺寸精度和力学性能。目前的多孔同轴送粉喷头或者环形同轴送粉喷头存在加工困难、粉末流发散角大及汇聚焦点无法调节等问题。本文基于空气动力学透镜提出一种可以线性聚焦的新型送粉喷头设计,研究了该新型喷头对粉末颗粒的聚焦性能,以及该喷头输送的粉末流
为提升电池系统的安全性及稳定性,采用电池管理系统对电池进行实时的数据收集与状况评估,为系统的管理与控制提供决策性参考及预测性维护等信息,其中,内短路故障诊断及容量估计是电池管理系统重要组成部分。论文分别提出内短路故障诊断方法及容量估计方法。对于内短路故障诊断,结合多分辨率小波降噪及动态时间规整算法,基于并联电阻模拟内短路实验获得不同程度内短路的充电时间-充电电压数据,提出了基于多分辨率小波降噪-曲
急性呼吸道感染(Acute Respiratory Tract Infection,ARTI)是一种常见的传染性疾病,主要由呼吸道病毒引起,严重威胁人类生命财产安全,近年来世界卫生组织不断呼吁各国加大对呼吸道病毒的防控力度。呼吸道合胞病毒(Respiratory syncytial virus,RSV)、人冠状病毒HKU1(Human coronavirus HKU1,HCo V-HKU1)、严重
剪切破坏模式下,钢混结构的延性及耗能能力较差,国内外对于剪力受力机理及破坏特征至今尚无统一的认识。钢筋混凝土框架结构通过柱抗剪以承担水平地震作用,其基底剪力是重要的结构抗震设计参数。因此,混凝土结构剪应力监测对于探索结构剪切破坏机理及准确确定地震作用输入水平具有重要意义。目前,混凝土结构缺少直接可靠的剪应力监测方法,基于剪切型压电陶瓷的压电智能骨料可进行混凝土剪应力监测,但其标定方法尚不成熟,监测
土壤有效硅可通过减轻作物生物胁迫和非生物胁迫的作用,进而增强作物的抗逆性以提高粮食产量,为此,探讨农田耕层土壤有效硅的分布特征及影响因素对于更进一步提高水稻产量具有重要意义。本文选择广州市从化区作为研究区域,共采集204个农田耕层土壤样点数据,通过化验分析得到土壤有效硅含量等土壤要素数据,利用地统计学绘制研究区农田耕层土壤有效硅的空间分布图,并在不同维度上分析农田耕层土壤有效硅的差异性。随后根据数