面向遥感图像分类与检索的深度学习特征表达研究

来源 :上海交通大学 | 被引量 : 2次 | 上传用户:l1301wz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着我国相继成功发射了高分一号“GH-1”、高分二号“GH-2”、高分三号“GH-3”、高分四号“GH-4”以及高景一号“SuperView-1”等高分辨率遥感卫星,遥感图像数据呈现井喷式增长,这预示着我们正式进入遥感大数据时代。这些数据已经广泛应用于土地利用、资源调查、环境调查、生态恢复、灾害防治、城市建设、国家安全等诸多领域。随之而来的问题是,面对海量的遥感大数据进行存储、管理、检索与分类,如何从高分辨率遥感图像中更加有效地提取特征,实现对高分辨率图像的特征表示,成为了当前高分辨率遥感影像应用面临的新挑战。面向对象的图像分析已经成为高分辨率遥感图像处理的主要手段,并且特征提取正在经历从传统的以光谱特征为主发展为图-谱相结合的人工设计特征提取,到近年来基于数据驱动的特征学习发展新时代。尤其是,在2012年,Krizhevsky等人提出了深度卷积神经网络(Convolutional Neural Network,CNN),是图像识别领域的里程碑式工作,并已在图像识别、目标检测等应用中都取得了巨大成功。基于此,本文以深度CNN为基础,对遥感图像分类与检索中的特征表达展开了深入研究:(1)在深度特征(如预训练CNN模型的全连接层特征)的基础之上,如何学习更具判别力的图像表示,是获得高精度遥感图像分类的关键因素。(2)CNN卷积层特征包含丰富的图像信息,如何从卷积层特征中提取有效的描述,是一个值得深入分析的问题。(3)CNN在一些小规模数据集上的精度趋于饱和,因此,基于大型数据集上的研究,如深度模型的迁移学习及其表示、深度特征的低维映射,是进一步提高分类或检索性能的关键。(4)已有的工作中,提出了许多基于哈希映射的方法来解决海量数据的检索问题,但多数方法采用的是人工设计特征,并且基于深度哈希表示的遥感图像检索研究也相对较少,有必要对其进行深入研究。论文的主要工作与创新如下:(1)全连接层特征提取与判别性卷积核学习:提出了一种提高卷积神经网络(CNN)全连接层特征可区分性的监督卷积核学习方法—DCK(Discriminate Convolutional Kernel)。首先,将CNN提取的4096维全连接层特征重排列为64×64像素的二维图像,以重叠的滑动窗口提取一系列图像块;再以类内最小、类间最大学习准则,学习图像块的判别性卷积核;最后将学习的卷积核应用于每一个图像块的特征变换。两个遥感图像数据集上的实验表明,在不增加特征维数的情况下,基于DCK的深度特征变换有利于提高CNN全连接层特征的分类性能。(2)深度局部描述子提取与特征编码:研究了CNN卷积层特征的局部描述子提取,并提出了描述子级与中层特征级的两种聚合策略,用于融合两种不同的CNN模型。首先,采用CaffeNet与VGG-VD16两种不同深度的CNN,并移除模型中的全连接层。其次,CNN模型的输入采用了图像金字塔,以提取图像在不同尺度下的卷积层特征。然后,将卷积特征图的通道数量作为特征维度,并将多幅卷积特征图在同一个空间位置的特征组合成单个描述子,分别采用Hellinger核和主成分分析对描述子作进一步变换。最后,采用聚合策略获得图像的全局表达。在两个遥感图像数据集上的分类实验表明,基于图像金字塔的深度描述子结合提出的聚合策略,可以获得比全连接层特征更高的分类精度。(3)跨数据集迁移学习表示与深度特征降维:数据是深度学习的核心问题之一,好的学习数据有时甚至比设计一个全新的CNN网络更加有效。因此,利用最近公开的五组大规模遥感图像数据集,分析数据集之间的交叉迁移CNN特征表示。首先,采用了CaffeNet与VGG-VD16两种不同深度的CNN模型,并利用遥感图像数据集对其进行微调学习,对微调后的模型,对比分析了两层全连接层特征的图像表达能力。其次,采用了随机投影的方式,对全连接层特征进行降维。实验同时评价了遥感图像分类与检索两种任务,跨数据集的迁移学习可有效分析不同数据集的泛化表达能力,为其他研究人员在学习数据集的选择提供一定的参考。随机投影降维的优点是不包含学习过程,可避免对大规模遥感图像数据集进行降维子空间的学习。(4)全连接层的深度哈希编码:基于特征编码或深度CNN提取的特征,维度往往比较高,会显著地增加图像之间距离度量的计算复杂度。尤其在大规模图像检索任务中,大大降低了图像检索的计算效率,并且,所需要的存储硬盘消耗也会比较大。研究了深度特征到二进制码映射的哈希全连接神经网络设计问题,提出了一种包含三层全连接层的哈希神经网络(FCHNN)用于图像特征的低维映射。FCHNN通过标签对的监督学习方式,可将中层特征(如Fisher向量编码)、预训练或微调CNN模型提取的深度特征映射至二进制码。与基于端到端(像素特征到二进制码)的哈希CNN相比,FCHNN具有学习效率高的优势。在存储空间上,当将4096维深度特征编码至64比特存储时,仅需8个字节。在五组遥感图像数据集的检索实验表明,FCHNN可以获得理想的编码效果和检索性能。
其他文献
在前期探明苹果酒特征香气种类的基础上,对苹果酒发酵过程中特征香气的近红外光谱检测模型进行了研究,结果表明选择波数为9747.1—7498.3cm^-1和6102.0—5446.3cm^-1两段谱区,采用一
浅谈商业银行的经营预测●郭昭川,马慧军随着国有专业银行向商业银行转变的进程,商业银行必须以科学的经营预测为依据。笔者就经营预测这一环节作以下阐述。商业银行的经营预测
针对相关电感参数难以通过实验精确测量而无法实现磁悬浮力精确控制的问题,根据电机磁路原理,推导出了拥有四极悬浮控制绕组的柱形转子无轴承二极电机各电感参数的一般化解析计
已经干涸的宁晋泊,地势低洼,属湖相沉积地层.我们在西洼剖面上,采集了8个标本,为了释光测定年龄技术的需要,对样品作了元素分析、组分分析、矿物组成分析,并对物源的形成做了
阐述了中空玻璃在水气密封耐久性能试验中,试验结果不符合标准要求时,中空玻璃的密封胶层的表现和原因分析。
目的:将不同氢氧化钙制剂用于根尖诱导成形术,探讨提高年轻恒牙根尖诱导成形术疗效的方法.方法:选择年轻恒牙和根尖周炎患者,共94个患牙,以不同氢氧化钙制剂行根尖诱导成形术
介绍了我国轮胎市场存在的问题:市场价格混乱;轮胎内在与外观及内胎、垫带质量存在问题;营销人员的整体素质有待提高;宣传力度有待加强.指出我国轮胎企业应寻求共同发展的道
我公司目前使用的版材为DL-NVS紫激光CTP版材,制版设备为方正雕龙DL8500-PLUSⅡ型直接制版机。整个制版过程包括曝光、预加热、预水洗、显影、后水洗、上保护胶、烘干。本文,笔
简述了轮胎行业存在的问题,指出:高层级轮胎的开发给用户带来可观经济效益的同时,也带来了许多负面效应;国内轮胎行业产品结构单一,开发步伐太慢,不能适应市场需求;企业随意降低三包