论文部分内容阅读
随着科技的发展,现代计算应用领域也越来越多的需要面临大量的高维数据,如航天遥感数据、全球气候模型、生物数据、图像分类系统、金融市场交易数据等。如何从高维数据中有效的提取最有效、最本质的信息成为迫切需要解决的问题。
数据降维技术是高维数据处理中非常重要的预处理步骤,是指样本从高维观测空间通过线性或非线性映射投影到一个低维空间,从而找出隐藏在高维观测数据中有意义的低维结构。但是现实中的数据具有非线性的特点,采用传统的线性降维方法很难发掘高维数据的结构和相关性,因此流形学习方法的研究得到了广泛的关注和重视。
本文介绍了当前流形学习的发展概况,对典型的流形学习算法进行了深入系统的分析研究,详细的比较了各种算法的优点和不足,并进行了相关的仿真实验。针对局部线性嵌入算法在源数据稀疏情况下失效的问题,提出了局部光滑逼近的流形学习算法.该算法通过直接估计梯度达到局部线性误差逼近最小化,实现了高维数据的维数约简,在源数据稀疏的情况下,该算法也能达到比较理想的降维效果。
通过对流形学习算法的分析研究,及其在人脸数据库上的测试应用,证明了流形学习算法能够有效的提取高维数、高复杂度数据源的内在结构性质和本质规律性,同时体现了其在人脸数据处理中广阔的应用前景。