论文部分内容阅读
高光谱图像分类是指通过分析地物的光谱特性,并根据某种规则来确定每个像素的所属类别,从而将待测地物划分为不同类型的区域,是人们认识和发现地物空间分布规律的一个重要途径。在高光谱图像分类中,常常需要足够多的标记样本来训练可靠的分类模型。然而,对样本进行标注是一件耗时、耗力的工作。另一方面,我们可以很容易的获得大量的未标记样本,因而,能够利用少量标记数据和大量未标记数据来学习的半监督分类算法成为机器学习领域的研究热点。其中,由于基于图的方法具有优雅的数学模型以及很好的解释性,受到了广泛的关注。基于图的高光谱图像半监督分类任务的关键在于,在高光谱图像数据上构造一个能真实反映样本间相似性关系的图。对于高光谱图像这样的高维度数据,由于数据的高维度性和非线性性使得传统的距离度量不能很好的刻画它们之间的相似性关系,从而不能构造一个良好的图结构。针对该问题,本文重点研究在稀疏表达模型框架下,如何学习得到一个有信息和判别性的图结构,使其充分挖掘高光谱数据的光谱和空间信息,以真实反映高光谱数据的内在结构,并应用于高光谱图像半监督分类任务中。首先,本文利用少量的标记信息来预估数据的概率类别结构,从而获得每个样本与每个类别的概率从属关系,然后将该概率类别结构信息融入稀疏表达模型中,提出一种基于概率类别结构约束的稀疏表达图算法,并用于高光谱图像半监督分类中。该图模型对具有不同类别分布的样本惩罚较大,即分配较小的权重给它们,而对具有相同类别分布的样本惩罚较小,即分配较大的权重,真实反映了数据的内在结构。实验结果表明,基于概率类别结构约束的稀疏表达图结构能够有效提升高光谱图像半监督分类性能。其次,针对传统的图构造方法没有考虑到高光谱图像丰富的空域信息的不足,本文对稀疏表达图从以下两个方面进行了改进:1)对空域相邻的样本赋予相似的权重系数;2)对不同类别分布的样本赋予较小的权重系数,提出一种基于空域和类别结构约束的稀疏表达图算法,并应用于高光谱图像半监督分类中。该方法不仅令不同类别分布的样本之间的权重尽可能小,而且保证空域上相邻的样本尽可能具有相似的表达系数,从而显著地提高了图的判别性。在多个高光谱图像数据集上的实验结果表明本方法能有效提升高光谱图像半监督分类性能。最后,针对现有的图结构要么是直接从原始数据来获得,要么是从数据的自我表达系数来获得的不足,本文尝试从一更具判别性的变换空间来构造图结构,提出一种基于表示空间的判别性的图构造方法,它可以同时学习数据的表示以及表示间的相似性关系。该图结构是根据样本表示间的欧式距离来构造的,它潜在的假设是,如果两个样本的表示之间的距离越小,那么它们属于同一个类别的概率越大。而且,本文在表示空间也考虑了样本的概率类别关系,从而进一步增加图的判别性。实验结果表明了该图构造方法的有效性。