论文部分内容阅读
自从进入了二十一世纪,人类迎来了互联网时代,这个新的时代给人类带来的是在知识获取,知识创造,知识传播等方面的巨大变革.当前的互联网主要采用文字检索的方式寻找人们感兴趣的内容,随着人们需求的不断增加,以及互联网技术的不断发展,科研工作者的研究兴趣已经从文字检索逐步转换到对图像和视频内容的检索,因此图像分析,图像理解方面的研究迅猛发展,而图像分类和图像分割是图像分析和图像理解的重要组成部分.本论文致力于图像分类这一重要课题,研究的对象包括对图像整体的分类和对图像局部内容的分类(图像监督分割)两大部分.近几十年来,稀疏表示一直是图像处理,图像分析与图像理解方面的热点课题.对稀疏表示的研究已经渗透到图像处理,图像分析与图像理解的方方面面.如此多的研究结果证实稀疏表示与图像有着密不可分的关系.因此,本论文所研究的图像分类方法都是在稀疏表示的基础上进行的.基于稀疏表示的图像分类算法大致由三个阶段组成:(I)稀疏表示字典的学习构造阶段;(II)稀疏编码特征提取阶段;(III)基于稀疏表示特征的分类阶段.而当前基于稀疏表示的图像分类主要面临三个问题:(I)构造稀疏表示字典的模型设计问题;(II)特征编码(稀疏表示)优化算法设计问题;(III)基于稀疏特征的分类器设计问题.本论文的内容就是围绕这三方面的问题展开,并获得以下成果:在第二章,本文针对稀疏表示凸松弛问题设计了一个最优化算法,并将其命名为不完全变量截断共轭梯度算法.该方法利用对Karush-Kuhn-Tucker一阶最优化条件违反程度的度量,将被优化的变量分为主要,次要两个部分,并分别对两个部分进行优化.针对主要的变量这个方法使用截断共轭梯度算法,从而将更多的计算资源投入主要变量的优化,针对次要部分的变量,这个方法使用最速下降算法,从而节省了计算资源.由于计算资源的合理分配,这一方法可以快速地收敛到目标函数的解.当然该方法不仅拥有良好的运算性质,它还具有非常优秀的理论性质,即有限步收敛的性质.在第三章,本文提出了一个综合字典学习和稀疏编码的特征提取方法,并用于高光谱图像的像素分类,该方法被命名为空谱稀疏编码方法.该方法首先采用两阶段相似度传播聚类算法结合空间近邻策略用于构造空谱字典,然后采用局部约束稀疏编码方法提取像素的空谱特征,该稀疏特征提取方法具有字典学习和稀疏编码速度快,获得特征稀疏度高,存储成本小的特点,不仅如此,由该方法提取的稀疏表示特征还可以被线性支持向量机快速高精度地分类.在第四和第五章,本文提出了两个基于稀疏表示的分类算法,它们分别是用于人脸图像识别的证据推理分类算法和奇异点清除稀疏表示分类算法.由于这两个算法都是针对含噪图像而设计的,因此它们共同的特点就是寻求方法抑制训练样本中的噪声.不同之处在于,前者利用证据推理理论采用构建置信规则库的方式平抑人脸类噪声,而后者则是对每一个训练样本学习一个表征奇异程度的权值,进而达到抗人脸遮挡噪声的目的.由于采用了抗噪策略,这两个算法分别在类噪声和遮挡噪声条件下获得了非常好的分类效果.