面向弱标注图像的硬注意力算法的研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户：zql0913

【摘要】

：

针对图像识别问题,传统的深度学习方法往往需要对整个输入图像进行编码,无法有选择性的重点关注关键信息部分,且对数据集的要求较高,不仅需要人工对数据集进行加标签的工作,

【作者】

：

陶慧

【出处】

：

南京信息工程大学

【发表日期】

：

2020年01期

【关键词】

：

硬注意力弱标注图像识别强化学习领域自适应对抗训练

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对图像识别问题,传统的深度学习方法往往需要对整个输入图像进行编码,无法有选择性的重点关注关键信息部分,且对数据集的要求较高,不仅需要人工对数据集进行加标签的工作,而且当图像数据上同时包含主体和背景信息时,往往需要人工对主体信息加上标定框,这无疑消耗了大量的人力、物力和财力。模仿人类视觉注意力机制,深度学习中的注意力机制应运而生。硬注意力机制作为注意力机制的一种,其可以选择性地将输入图像中的某部分关键信息输入到网络中进行特征编码,减少了人工标注标定框的成本。因此,面向弱标注图像识别的硬注意力算法的研究是一个重要的课题。本文提出了一种新的硬注意力算法用来解决弱标注图像识别问题。然而,实际应用场景中,训练集(源域)数据和测试集(目标域)数据往往具有较大的分布差异,使得在源域上训练好的分类器无法很好的对目标域数据进行分类,同时某些领域的数据量稀少甚至没有任何标记信息,领域自适应可以解决源域和目标域数据集间的分布差异,通过对齐源域和目标域的特征表征,从而可以将在丰富标记信息的源域数据上学习到的分类器应用于无标记信息的目标域上。本文分析了领域自适应相关算法及研究现状,通过基于硬注意力迁移的对抗领域自适应算法的研究提高了领域自适应中目标域图像分类效果。本文基于硬注意力机制,完成了以下几个方面的工作:(1)本文从弱标注图像识别角度出发,分析了注意力机制的原理及其相关应用,证明了硬注意力机制在弱标注图像识别中的有效性,并介绍和详细推导了硬注意力机制中的优化算法REINFORCE,其次介绍了领域自适应工作的研究必要性和原理及其目前相关研究现状,重点介绍了对抗领域自适应算法,并分析了基于硬注意力迁移的领域自适应研究的合理性。(2)受循环注意力模型的启发,本文提出了一种面向弱标注图像识别的新的硬注意力模型算法:pan-zoom,该算法在我们设计的强化学习奖励函数的引导下能够通过平移或缩放两种离散的动作选择逐渐定位到弱标注图像中最具有区分度的注意力特征位置,最终识别出弱标注图像类别。本文详细阐述了我们设计的网络模型的结构及其功能,并介绍了本文使用的四个弱标注图像数据集,通过在弱标注图像上的实验及其分析证明了pan-zoom模型的有效性。(3)受到对抗判别领域自适应算法的启发,本文结合循环注意力模型,并针对该模型在无监督域适应过程中存在的不可微分和缺少标签等问题,提出了硬注意力迁移的对抗领域自适应算法,该算法为硬注意力的迁移提供了统一的框架,由于硬注意力模型包含了不可微分网络,需要强化学习的策略梯度算法进行优化,并通过利用判别器网络的输出设计的对抗奖励函数进而优化目标域硬注意力提取注意力特征位置的过程,本文统一将硬注意力模型看作是一个控制问题,即典型的强化学习问题。因此将硬注意力模型提取源域和目标域特征过程分别看作源域智能体和目标域智能体和对应数据集互动的过程,该算法通过目标域智能体和判别器网络间的对抗训练,最终对齐源域和目标域的注意力特征,从而实现硬注意力的迁移,提升了领域自适应中目标域数据的分类效果,该算法在多组领域自适应任务数据集间进行实验,并展示出硬注意力迁移的可视化效果图。

其他文献

基于数据挖掘的热泵系统节能运行及泄漏模式识别研究

暖通空调设备的节能高效运行是长期的研究目标。热泵空调系统将低品位热源转化为高品位热能,广泛应用于工程实际,从设计生产到长期运行各个阶段都会产生大量的数据。本文应用

学位

热泵节能运行分析故障诊断数据挖掘关联规则分析

外语微课的多模态话语符际间性研究

随着信息技术的快速发展,多模态话语分析在西方开始出现,话语意义得到进一步解释。国外学者认为话语或语篇就是一个语义单位,意义不仅仅能通过语言实现,也可以通过其他符号系

学位

微课多模态话语符际间性

级联型石英毛细管器件的传感机理比较研究

石英毛细管结构简单、成本低且具有天然的空芯圆对称结构,因此易于与光纤集成形成各种级联结构,是实现光纤传感器的重要载体。基于石英毛细管的传感器件主要包含法珀(Fabry-P

学位

级联型石英毛细管器件法珀马赫曾德尔多模干涉反谐振

改进Faster R-CNN雾霾图像目标检测算法研究

目标检测是计算机视觉领域中的重要基础研究,是图像内容理解问题的重要基础。随着机器视觉技术的深入研究,通过各种智能算法对图像中的目标进行准确识别和精确定位。但是在雾

学位

雾霾图像空域分割模型Faster R-CNN区域推荐定位优化

基于国产平台的LLVM JIT编译优化技术研究

申威系列处理器是采用自主指令集且具有完全自主知识产权的国产通用处理器,已经成功应用在超级计算机、高性能服务器、存储系统、网络安全等多个领域。LLVM作为开源编译框架

学位

申威处理器LLVM即时编译编译后端移植优化

期望位姿设定的移动机器人视觉伺服方法

伴着控制技术的不断进步,轮式移动机器人越来越多地应用于智能交通、家居服务、工业生产等领域。近几年,视觉传感器凭借其低成本和获取图像信息无需接触测量等特点,与智能化

学位

轮式移动机器人视觉伺服单应矩阵无线通信技术

基于DSP的晶体管式精密电阻点焊电源研究

电阻点焊作为一种重要的焊接方法,广泛应用于航空航天、汽车、五金、电子及医疗器械等多个领域。近年来,随着器件、设备的小型化,微型零件的电阻点焊的应用越来越多。微型零

学位

晶体管式电阻点焊电源DSP多模式控制

改革开放以来学界关于政党制度的概念界定

政党制度是一个国家各政党参与政权的制度性规范,体现了各政党在国家政权与社会结构中的地位作用、相互关系、运作方式、实现形式等。改革开放以来,关于政党制度理论的研究日益兴盛。随着政治、经济、社会环境的变迁,特别是政党、政府及社会关系的变化,关于政党制度概念内涵的界定在不同时期也有所不同,代表性观点有“体制说”“制度说”“综合说”等。探究政党制度概念内涵的理论逻辑,理清概念发展的历史脉络和实践效果,有助于在国内外政党制度的实际对比中,凸现中国政党制度的鲜明特色和显著优势。

期刊

改革开放以来政党制度概念界定

基于红外成像模型的夜雾图像去雾算法研究

红外成像系统依据目标物体自身发出的热辐射信息成像,使所获取的红外图像能够显示出具有高热辐射量的场景信息,而低热辐射量的场景信息会在背景热辐射中湮灭。近年来,红外成

学位

红外图像红外成像模型改进引导滤波CLAHE算法

基于特征传播与融合的视频目标检测研究

目标检测对物体进行识别和定位,在视频监控、智能机器人、自动驾驶等视觉应用系统中承担着对场景进行基础建模的重要作用。由于深度学习的引入,基于静态图像的目标检测算法有

学位

视频目标检测特征传播与融合循环神经网络自注意力机制光流

面向弱标注图像的硬注意力算法的研究

其他学术论文