论文部分内容阅读
随着遥感设备和技术的快速发展,我们可以通过多光谱/高光谱图像和合成孔径雷达来得到更多深入观察地球的机会。遥感设备帮助我们捕捉到越来越多不同类型、不同分辨率(空间分辨率、光谱分辨率和时间分辨率)的机载或卫星图像。这些图像的高维度成为特高分辨率(High Resolution,HR)场景分类的巨大挑战之一,同时也要求采用更有效的方法来实现土地利用及覆盖的图像场景分类,这也是遥感图像领域中最重要的任务之一。HR图像场景分类中最重要的一步是特征提取,它将图像场景表示成特征向量的形式。根据像素级/图像级的表示可以将已有的HR图像场景描述方法分成三类,这些方法都直接依赖于图像场景的全局表示。本文我们关注于HR图像场景分类中的特征提取方法,提出能够对HR图像场景中带有不同几何性质的区域如机场、建筑、森林等进行准确分类的技术。目前已有若干应用与监控人类活动下的自然环境密切相关,而HR图像则为他们提供了非常有用的信息。HR图像场景分类致力于提取能够表示目标区域的特征,但与HR图像相关的大规模数据却使得分类问题变得非常复杂,而目前可用的方法仍然不足以来分析这类遥感数据。基于此,为了增强自动提取HR图像场景中有用特征的能力,本文的总体目标是提出创新的技术来对HR图像进行分析和分类。具体来讲,本文主要考虑以下几个问题:根据特定的语义类别集合来标注HR图像场景是一件十分重要的任务。考虑到属于同一类别的地表可能有着非常大的变化,且目标可能出现在不同的尺度和方向上,我们提出了一个基于CNN模型的HR图像语义分类方法。首先,我们采用在Image Net数据集上预训练的VGG模型来对原始的HR图像提取特征。接着,VGG网络的全连接层输出将被联合起来形成HR图像场景的最终表示。第二,我们选择VGG-Net构造的全连接层,其中每一层可视为分离的特征描述子。然后我们把它们放到自编码器中来构造HR图像场景的最终表示。我们对HR图像场景分类的相关文献进行了深入的研究,并在2节就现有方法的局限性进行了说明。为了解决这些问题,我们提出了若干创新方法,并在真实遥感图像上进行了实验验证。大量的实验结果表明,本文所提出的方法在HR图像场景分类任务上是十分有效的。