论文部分内容阅读
随着计算机技术、通信技术和传感器技术的不断发展,海量的遥感数据光谱信息不断地被存储下来。高光谱遥感技术的出现,使得光谱分辨率不断提高,地物的光谱信息更加丰富,这也使高光谱遥感成为二十一世纪遥感领域重要的研究方向之一。目前,高光谱遥感已经在精细农业,森林监测,土地利用,海洋监测、大气监测等诸多的科学领域取得了成功的应用。而随着高光谱遥感图像的不断获取,数据量增多,面对着海量的数据,我们如何从中提取出我们所关注的部分,如何发现其中细微的差异以及变化,如何得到更精确的信息等等问题,都亟待我们解决。随着大数据时代的到来,云计算日益兴起,数据挖掘技术也已经逐步被应用到土地利用,海岸线监测,森林监测,大气监测等领域。特别是在高光谱遥感影像的分类研究中,空间数据挖掘技术起到了不可替代的作用。近年由于遥感图像光谱以及空间信息的大幅度增长,数据量大大增高,而在这些大量的数据中,想要获取所有数据的类别信息异常困难甚至是不可能完成的。我们得到的数据只有很少一部分具有类别信息,大量数据都是未知类别信息的。机器学习和模式识别领域重要的研究方向之一——半监督学习,因其可以通过少量的有类别信息的样本点辅助大量的无类别信息的样本点进行分类,而得到广泛关注和应用。无监督分类忽视了样本信息,往往得不到理想的精度。而监督分类需要标记大量的样本点,带来了巨大的工作量。所以半监督分类的优势逐渐显露。本文首先对空间数据挖掘和高光谱遥感影像及其分类技术做了介绍,然后对监督分类、无监督分类和半监督分类及其相关算法做了详细的描述,着重介绍了经典的FCM算法及其在半监督方向上的多种改进方式。在此基础上,本文对半监督FCM算法的目标函数以及聚类中心和隶属度矩阵分别做出改进,提出了一种新的半监督分类方法。该算法充分利用了有标签样本点在迭代过程中所起的作用。将改进的算法应用在两幅高光谱遥感影像数据:Indian Pines,Pavia University还有UCR数据集的分类问题上。实验结果表明,本文所改进的半监督FCM算法分类结果较好。