论文部分内容阅读
谱聚类算法建立在图论中的谱图理论基础上,其本质是将聚类问题转化为图的最优划分问题,是一种点对聚类算法,对数据聚类具有很好的应用前景。相比于传统的聚类算法,谱聚类能够识别非凸分布的聚类,而且可以获得在放松了的连续域中的全局最优解。但是该算法目前仍处于研究的初期,算法本身仍存在一些问题。本文以谱聚类算法为基础,结合聚类集成、半监督学习、深度学习提出了一系列新的算法,以克服现有谱聚类算法的缺陷并提高聚类精度。本文主要工作概括如下: 1.提出了一种基于压缩感知谱聚类的集成算法,并将其应用于高光谱图像的分割。压缩后的随机特征,k均值算法的随机初始化以及Nystr?m逼近为该集成算法提供了必要的多样性。与此同时我们使用SVM对图像进行了像素水平上的分类。最后运用空谱分类的思想将分割图与分类图结合在一起,实现对高光谱图像的最终分类。 2.提出了一种新的基于约束谱聚类的集成算法。该算法不仅充分利用了已知的先验信息,同时相对于单个学习器,算法性能更加稳定。与一般的基于互联合矩阵的聚类集成算法不同,这里互联合矩阵被看作一种新的约束信息引入到谱聚类算法来得到最后的聚类结果。此外,集成系统中的个体谱聚类的尺度参数在有限区间内随机选择,这样不仅避免了尺度参数的选择问题,同时又增加了集成系统的多样性。 3.针对谱聚类算法的算法复杂度过高不适于处理大规模数据的问题,我们利用Autoencoder构造的深度学习网络对原始的样本数量进行约减,然后在处理后的少量样本集中进行谱聚类,并提出了两种方法来得到原始样本集上的聚类结果。