论文部分内容阅读
遥感技术的迅速发展使得研究人员可以较容易地获取大量高质量的高空间分辨率光学遥感图像,这些图像包含丰富的目标细节信息和复杂的目标空间结构信息,为实现大范围场景理解和语义信息提取提供了可能,在国民经济和国防建设中都发挥着重要的作用。这其中,基于光学遥感图像的目标检测得到了学者们大量的研究。然而由于舰船目标自身存在的一些检测难点,这些目标检测算法在舰船检测上仍难以取得令人满意的结果。深度学习具有极强的特征学习和表达能力,能够提取复杂的图像全局信息和目标上下文信息,本文对基于深度学习的光学遥感图像自动舰船检测进行了深入研究,主要工作和贡献如下:(1)对近年来深度学习、光学遥感图像目标检测、光学遥感图像舰船检测的国内外研究现状进行了总结和概述。简要分析了在计算机视觉领域广泛使用的卷积神经网络的架构,包括卷积层、下采样层和分类层。介绍了三类典型的卷积神经网络:VGGNet、GoogleNet和ResNet的网络结构和实现原理。同时详细介绍了基于卷积神经网络的两类里程碑式目标检测框架——单阶段目标检测框架和双阶段目标检测框架。(2)针对光学遥感图像中舰船目标尺度变化剧烈且小目标居多的特点,提出了联合使用图像金字塔、特征金字塔和感受野金字塔的多尺度覆盖策略。同时对图像金字塔、特征金字塔和感受野金字塔涉及到的关键问题进行了详细地探索。对于图像金字塔,包括图像金字塔的使用策略问题(训练、测试阶段单独使用,还是联合使用),非极大值抑制算法的选择问题;对于特征金字塔,包括特征金字塔的网络结构设计问题、候选锚框的生成尺度问题;对于感受野金字塔,包括感受野的尺度问题。(3)针对光学遥感图像中舰船目标密集排列、任意方向、极端纵横比等难点问题,提出采用基于旋转边界框的检测方案。首先通过旋转区域候选网络生成高度定制化的带角度旋转边界框对舰船目标进行粗略检测,接着通过基于最小外接矩形的感兴趣区域池化得到感兴趣区域的深层特征,然后通过多尺度、多区域感兴趣区域池化进一步优化感兴趣区域的特征,最后利用回归检测网络对舰船目标进行精确检测。该方案采用旋转边界框对舰船目标进行定位,有效避免了密集目标的检测框大量重叠的问题,同时通过角度变量的回归解决了舰船目标的任意朝向问题。通过多尺度、多区域感兴趣区域池化则有效改善了油污、岛屿等对舰船检测的干扰问题。在大规模光学遥感图像数据集DOTA上的定性、定量实验结果表明了本文提出的算法相对于当前主流算法的有效性和先进性。