【摘 要】
:
近年来,从多个数据源得到的多种形态的数据呈现指数级爆炸型增长,如何有效提取隐藏在繁杂数据表象下数据内在性质及规律是机器学习等领域研究的热点。多流形模型中观测数据位于或近似于多个嵌入在高维欧氏空间中的内在低维流形上这一假定符合聚类分析寻找观测数据多个互不相交分组的学习任务。而采用谱分析方法学习数据的流形结构是一种行之有效的方法。因此本文希望能通过学习数据的谱流形结构实现对其的聚类学习。本文主要工作包
论文部分内容阅读
近年来,从多个数据源得到的多种形态的数据呈现指数级爆炸型增长,如何有效提取隐藏在繁杂数据表象下数据内在性质及规律是机器学习等领域研究的热点。多流形模型中观测数据位于或近似于多个嵌入在高维欧氏空间中的内在低维流形上这一假定符合聚类分析寻找观测数据多个互不相交分组的学习任务。而采用谱分析方法学习数据的流形结构是一种行之有效的方法。因此本文希望能通过学习数据的谱流形结构实现对其的聚类学习。本文主要工作包括如下三个方面:(1)提出了多流形谱嵌入聚类学习算法,算法构建同时记录样本数据点于原始观测空间及映射流形中位置结构信息的相似度矩阵,并采用数据流形映射信息进一步对其规范约束,从而通过增强对数据点真实位置的判断实现对聚类性能的提升。在易混淆数据子集及真实数据集上的实验结果证明了算法的有效性。(2)提出了自适应多视图谱流形聚类学习算法,算法通过对相似度矩阵施以限制使其能自适应学习每一视图权重从而无参的完成对多视图数据信息的融合,并使此矩阵能直接得到样本数据点的簇划分。并且算法通过将对每一视图数据流形结构的判断作为指正信息引入模型,进一步提升了算法模型的学习性能。此外算法在构建得到的数据子集上进行谱分析计算,一定程度上减轻了算法的计算负担。在人工数据集和真实数据集上的实验表明,该算法相较于其他算法有更好的性能。(3)提出了多视图谱网聚类学习算法,算法构建深度网络模型实现对多视图数据集的谱聚类学习。模型提供映射函数为多视图样本数据点提取低维融合嵌入流形特征与判断簇标签。并能够利用多视图数据信息互补这一性质通过构建的数据融合层的回馈修正单视图数据嵌入分支,实现对数据点位置更为精准的判断。同时,算法还具有能够聚类大规模数据集以及处理样本集外拓展等优点。在人工数据集和真实数据集上的大量实验有效证明了算法的优越性能。
其他文献
建立动力学模型对反应器的设计和优化具有重要意义。本实验用钯/泡沫镍电极(Pd/Ni foam)作为阴极,对4,4’-二氯联苯(4,4’-DCBP)和2-氯联苯(2-ClBP)分别在全混流反应器(CSTR)
我国森林面积广阔,森林火灾频发,森林火灾以及由此带来的经济损失凸显了森林火灾风险管理的重要性。森林保险制度作为森林风险分散的重要工具,受到很多国家的重视。本文以森
城镇保障性住房业务管理系统是一个典型的业务管理类ERP系统。本系统的开发工具为Visual Studio 2015+Microsoft SQLServer 2008,利用其提供的各种面向对象的开发工具,尤其是
宫颈癌是最常见的妇科恶性肿瘤,在全世界范围内,美国、欧洲等地的发病率呈缓慢下降趋势,但大部分发展中国家其发病率不断升高,早期宫颈癌的治疗主要是手术治疗,而中晚期疾病
除尘器和引风机作为燃煤机组烟道系统中不可或缺的两个设备,其进、出口烟道烟气流场的均匀性将直接影响设备的工作效率及机组运行的安全性。近期国内大多数燃煤机组为贯彻落实“减能减排”政策,选择在除尘器进口烟道中加装低温省煤器来降低机组能耗、提高除尘器效率,而除尘器进口烟道中流场不均又会加剧低温省煤器中换热管束的磨损。同时,引风机进、出口烟道流场不均匀也会严重影响引风机的安全运行。因此,对燃煤机组空预器至脱
目的本研究建立吗啡成瘾大鼠模型,以奖赏通路中伏隔核作为研究切入点,运用分子生物学和行为学方法,探讨大鼠伏隔核PKMζ在吗啡成瘾中的作用。以期进一步明确成瘾记忆的机制,
随着控制、网络及通信技术在复杂控制系统中的发展与相互融合,网络化控制系统(Networked Control Systems,NCS)在自动化领域的研究变得尤为重要。传统控制系统因为网络的加入,使系统的控制性能得到扩展和增强,与此同时也存在使控制系统不稳定的因素,例如:网络延时、数据丢包、网络调度的问题等。因此,对网络化控制系统的研究具有非常重要的现实意义。控制领域中,控制器的设计一直是控制系统线
在移动互联时代的大背景下,音频数据分享给人们带来方便的同时,也容易造成数字版权的篡改和盗用,从而数字水印技术应需而生。音频数字水印抗毁性的研究对于数据的安全至关重
金华火腿作为极具中国特色的干腌火腿,其以独特的品质在国内外久负盛名。风味是评价火腿品质及等级最重要的指标,这依赖于内源酶和微生物的作用。目前对火腿风味的研究仍较为局限,微生物对火腿风味形成的作用及其重要性并未深层次挖掘。此外,研究表明Autoinducer-2(AI-2)信号分子与食品的腐败和发酵过程有关,但目前关于AI-2与食品风味形成的研究相对较少,针对AI-2/LuxS群体感应系统(Quor
在科学技术飞速发展的21世纪,检测和分析手段的多元化让人们对自身以及环境有了越来越多的认识,也使得人们对自身和环境的重视程度越来越高。过去许多的检测手段和分析方法由