论文部分内容阅读
维数约简是机器学习、模式识别等领域的一个非常重要的问题,理论研究上已有许多经典的好方法,如主成份分析(PCA)、多维定标(MDS)等。这些方法使用的前提都是假设待处理的数据点近似具有某种全局线性结构,然而在实际问题中,很多数据集是非线性的,或者说位于一些不规则的碎片流形上。在这种情况下,传统的线性方法已经不能正确地、有效地描述数据点的内在真实结构。
对于非线性降维的研究一直以来都是一个令人感兴趣的话题,近年来,一类特殊的非线性降维方法引起了人们的极大兴趣,例如等距特征映射(ISOMAP)、局部线性嵌入(LLE)等,由于这类算法主要是研究数据点近似位于一个被嵌入到高维空间的低维流形上的问题,所以也把这类算法统称为流形学习方法。当前流形学习已经成为数据降维领域的一个研究热点,并且在数据的可视化,以及人脸图像、文本、数字识别等领域获得了较好的效果。
最初的一些流形学习算法多是无监督的学习方法,随着研究的深入,人们又将这些算法推广到监督学习问题中。本文在研究了监督流形学习机理的基础上,提出了两种新的有监督流形学习算法,数值实验证明了算法的有效性。同时本文还对半监督流形学习算法做了一些有益的探讨。论文最后对流形学习方法在实际问题中的应用做了一些研究。