图像的特征学习方法与应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：lxy901123

【摘要】

：

图像的特征表示是计算机视觉和图像处理的一个基本问题，例如，在图像识别与分类问题中，同一个物体，由于受到拍摄环境、角度、距离、时期等的影响，在图像中会呈现出不同的变化;同理，

【作者】

：

高永强

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

图像识别特征表示深度学习支持向量机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像的特征表示是计算机视觉和图像处理的一个基本问题，例如，在图像识别与分类问题中，同一个物体，由于受到拍摄环境、角度、距离、时期等的影响，在图像中会呈现出不同的变化;同理，同一类的物体，也会由于受到各种变量的影响，而呈现复杂的变化。有效的图像特征一般满足两个要求:对类内变化具有鲁棒性;同时，也要对图像内容有较强的描述能力，并具备一定的区分性。早期的图像特征如SIFT，HoG，LBP等，主要通过人工设计获得。近年来，研究者们根据不同的应用和特定的任务，设计出不同的提取特征的策略，并提出许多基于学习的图像特征提取方法，在图像匹配、物体识别、图像检索等任务中取得了良好的效果。基于学习的特征的研究，具有非常重要的意义。　　本文首先以局部特征的研究为出发点，采用学习的策略，对目前较流行的二值特征进行深入研究。物体识别和物体匹配任务，往往采取提取兴趣点的方式，围绕兴趣点周围构建图像块，从该图像块提取具有高鉴别力的特征描述子。传统的特征描述子通常经过手工设计，并采用浮点型数据进行存储。这种描述子一方面由于手工设计，不具有很强的泛化性，另一方面采用浮点型的特征描述子在特征提取和匹配上具有较高的计算复杂度。二值特征优势在于快速生成、快速匹配和合理利用内存，同时具有较高的鉴别性。本文在局部二值特征领域的研究成果主要有三点:第一，提出一种LTD(Local TernaryDescriptor)描述子，该描述子是对BRIEF(Binary Robust Independent Elementary Features)描述子的改进，采用三元替换二元进行编码;第二，开发出一种新型的二值特征，即RMGD(Ring-based Multi-Grouped Descriptors)描述子，该描述子采用环扇区域进行采样，并通过AdaBoost的位选择得到紧凑的二值特征，最后采用凸优化的方法将不同特征图得到的紧凑二值特征进行拼接，RMGD描述子在Brown图像块数据集获得目前的最佳性能（二值特征领域）;第三，将目前的几种二值特征用凸优化的方法进行融合，其性能与最佳浮点型描述子具有一定的竞争性，且兼并有二值特征的优势（计算快、存储低和匹配快）。　　其次，本文考虑将局部特征拓展到全局特征，由于二值特征对整幅图的覆盖性差，以及对方向比较敏感，我们采用传统的SIFT特征，同时和HoG特征进行稠密采样，并联合作为对整幅图像的全局特征表示。依据BoVW模型，本文对提取的特征采用Fishervector编码，应用到人脸属性分类任务中。对于人脸属性的分类任务，同一个人，由于采集环境、采集角度、表情变化和图像质量等的不同，在不同的数据域可能呈现较大变化，如果采用固定的模型参数，可能会影响最后的分类效果。本文根据人脸的特殊性，提出有意义的人脸部件，采用稠密采样对每个部件图进行图像表征，通过迁移学习和自适应学习分别对人脸属性分类任务进行研究，具体研究成果包括:第一:根据Fisher vector脸，提出增强的Fisher vector脸，分别对原图进行稠密的SIFT采样和稠密的HoG采样;第二，提出一种基于部件的迁移模型，在不同数据域—正面人脸图与非限定约束的人脸图，以及红外人脸图与可见光人脸图—分别进行迁移学习，在性别分类任务中取得良好的效果;第三，提出一种基于小样本学习的自适应模型，该模型只采用目标数据域，根据部件之间的互补性和模型参数的融合，得到很好的性能，在人脸属性分类中取得很好的效果。　　目前，基于深度学习得到的特征具有很强的泛化性和鲁棒性，深度学习在图像分类领域取得非常好的性能，本文最后尝试采用卷积神经网络对人脸属性分类任务进行特征学习和分类学习，这种特征描述子将特征的提取过程和分类过程联合优化，相比传统浅层特征提取方法具有相对较好的泛化性和精准性。首先讨论几种经典的卷积神经网络的模型，分析和比较这几种深度网络模型;其次讨论和分析在人脸识别任务中经典的DeepID系列模型，改进DeepID网络模型，提出DeepFA网络结构，并在人脸属性任务中取得良好的效果。

其他文献

自动文摘中若干技术的研究

该文以自动文摘为背景,对一些关键技术如中文文本的自动切分、模式匹配问题以及网络信息处理等展开了较为深入的研究,在一些领域取得了一定程度的进展,有些成果还具有基础性

学位

自动文摘中文自动分词中文电子词表模式匹配算法复杂法超文本

智能数据挖掘方法与应用研究

该文着重研究了智能数据挖掘的方法和应用.对于数据挖掘的方法,该文讨论了神经网络的奇异值分解设计法,方法采用完善的线性方法用于网络训练及网络适当结构的选择上,并在网络

学位

数据挖掘神经网络遗传算法决策树关联规则

电力市场综合资源度与竞标

由于在电力市场中即使不考虑多机构参与和随机性因素而去找出问题的最优解也是NP 问题,所以,在实际应用中,找到一个概率意义上的满意解也许比找最优解更为可行.对此,研究者采

学位

电力市场电力市场竞标竞标策略资源经济凋度

模糊神经网络在两足步行机器人控制中的应用研究

该论文主要针对HIT-Ⅲ型两足步行机器人动态行走中的模糊神经网络关节控制器进行了研究.该文设计了一种BP型模糊神经网络(FNN)控制器来控制HIT-Ⅲ机器人的关节电机.该网络由

学位

两足步行机器人模糊神经网络DCL算法梯度下降法

复杂系统建模与控制的研究及在精馏过程中的应用

该文的主要成果表现在以下几个方面:(1)针对多神经网络模型,提出了一种基于广义信息熵融合策略优选子网络的方法.(2)提出一种适用于多神经网络模型的多步并行递推预报误差(MP

学位

多神经网络模型广义信息熵误差算法软测量模型预测控制PID控制器

冷冻机组状态监测与故障诊断专家系统的开发与研究

该文以上海石化股份有限公司委托化东理工大学建立1冷冻机组在线监测与诊断系统任务为背景,根据国内外状态监测与故障诊断系统发展趋势,结合冷冻机组的工况,设计开发了一套分

学位

状态监测故障诊断振动检测专家系统神经网络模糊诊断

基于神经网络的磁轴承控制系统

该文以有源磁轴承的轴向单自由度的控制系统为研究对象,主要对基于神经网络的非线性控制作了深入的研究.简要介绍了磁轴承以及神经网络在国内外的发展概况.讨论了磁轴承的机

学位

有源磁轴承神经网络控制Elman网络非线性系统自适应控制

RM501机械手伺服控制系统的研究

首先,建立了RM501机械手的机构模型,详细分析了RM501机械手的运动学正问题和逆问题,获得了一组正解公式和逆解公式,并且对RM501机械手的运动学进行了仿真.其次,RM501机械手的

学位

RM501机械手运动学正问题运动学逆问题图像处理

基于内联网/互联网的物料管理系统

该文采用近年来飞速发展的INTERNET/INTRANET技术(网络数据库,POWERBUILDER/ASP/ADO数据库开发技术)以中小型企业为系统环境,提出了基于内联网/互联网的物料管理和控制的概念

学位

物料管理内联网/互联网网络数据库库存控制采购管理销售管理

仿射非线性生不确定系统的鲁棒控制

该文内容包括以下几个方面:作为研究H控制思想应用于非线性控制的新结果,我们在一种工程应用背景之下,考虑了类具有中立型不确定性的非线性生系统的鲁棒H控制问题,基于JJI不

学位

鲁棒H控制非线性系统时滞系统混沌系统

图像的特征学习方法与应用研究

其他学术论文