论文部分内容阅读
随着现代科学技术的迅速发展,高维数据大量出现在如计算机视觉、机器学习、生物信息以及航空航天等众多领域。高维数据不仅难以被人们直观理解,而且难以被现有机器学习和数据挖掘算法有效地处理。降维算法是处理这些高维数据的一个重要手段,也是特征提取的重要工具。虽然在数据降维处理方面已经有了大量的研究工作,但是在线性与非线性流形降维领域仍然存在许多具有挑战性的问题:如小样本问题,out of sample问题以及分类问题等。在2000年,《Science》上的三篇文章分别从神经科学与计算机科学的角度对降维问题进行了阐述,这不仅进一步促进了降维问题的研究,同时也推动流形学习成为当前机器学习研究中的一个热点问题。本文围绕数据降维算法及其应用展开研究,重点对线性的降维算法以及流形学习算法进行了研究,提出了一种新的无监督降维算法。论文的主要工作包含以下几个方面:(1)对传统的线性降维算法以及流形学习算法进行了深入研究和探讨,比较了它们之间的优缺点。(2)通过在仿真数据集上进行实验进一步说明各种降维算法间的不同,详细比较了各算法的计算复杂度以及内存需求。(3)提出了一种新的无监督降维算法,即鲁棒的基于局部以及全局结构的降维算法,该算法能够自适应地发现高维数据中的流形结构,同时对于参数的选择具有鲁棒性。与传统的流形学习算法不同的是,本文所提出的算法的识别性能不受近邻参数的影响。在三个广泛应用的人脸数据库上进行的人脸识别的实验展示了本文所提出的算法在人脸识别中的有效性。