面向精确图像理解的深度学习与视觉注意技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:ljxue1224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像理解是对图像处理及其应用的一个重要方面,其主要涉及到对图像中目标的识别、检测等,通过对于图像中所含目标之间的关系进行分析,来理解图像中的内容。在实际应用中图像理解涉及到多个方面,例如目标识别、场景理解、图像中目标定位、大规模图像检索、图像分割和图像标注等。本文主要基于大规模图像检索和图像自动标注来展开相关研究。在计算视觉中,基于深度学习的图像处理成为人工智能领域非常成功的一个突破方向,其具有非常强大的特征表达能力以及学习能力,而且当前智能时代计算能力的迅速提高使得深度神经网络能够在深度和广度上都能进行扩展,来利用大规模的训练数据。在图像检索和图像自动标注这两个方面,都涉及到对图像的内容进行理解。不管是图像的相似性比较还是图像的标注问题,都是针对图像中的某些有效区域,而不是整幅图像来进行处理。本文提出基于细粒度的图像区域处理方法,来解决图像检索和图像标注这两个方面的问题。针对图像检索中的特征提取和哈希学习问题,图像的特征表示至关重要,因为它能够在最后的检索中真正保证检索结果的召回率。本文提出结合Proposal和深度卷积神经网络的框架来进行细粒度进行图像的特征表达,以进一步提高图像检索的性能。该框架的特点是面向没有ground-truth框的多标签图像数据集,首先采取无监督方法的proposal方法来产生可能包含目标的候选框,再利用深度卷积神经网络来提取区域性的图像特征表达,基于这些细粒度特征再进行图像哈希函数的学习。本文通过在三个有代表性的公开数据集上进行验证,通过与已有的方法进行对比,表明这种细粒度方法更能够准确表示图像中的有效信息,明显提高了检索结果的性能。针对图像的自动标注问题,本文提出结合视觉注意机制的循环神经网络来进行图像的标注。现有的大多方法,一种是利用手动提取图像中低层的视觉特征与已有的特征模式进行匹配,然后确定图像中有什么目标,另一种是基于卷积神经网络来进行图像中多种标签的预测。本文提出序列化地处理图像中的局部区域,对其进行准确识别,并通过实验验证了该方法的有效性,并且能明显地提高图像自动标注的结果。本文主要研究深度学习的相关技术,并结合图像理解中的具体问题进行研究,提出了新的方法并通过大量的实验验证了新方法对于解决该问题的有效性。
其他文献
据文献记载和作者实际调查,我国各地花椒属(Zanthoxylum L.)植物果实作药用者计约18种。本文先报道其中8种果皮的形态组织学研究结果:花椒Zanthoxylum bungeanumMaxim.青椒Z.
本文运用PLC控制技术和直流调速技术改造大型龙门刨B2025的电气控制系统和直流驱动系统,讨论了机床的控制及驱动要求,完成了整个系统的硬件设计和软件设计,并给出了详细的速
介绍了防静电雷管生产线的原理,即从设施、环境、管理等方面采取综合措施,尽最大可能减少静电起电的能量,降低静电危害.
目的:通过建立大鼠牙周骨缺损模型,采用甲状旁腺激素(parathyroid hormone,PTH)(1-34)联合引导骨组织再生来修复牙周骨缺损病变,探讨分析运用PTH(1-34)联合引导骨组织再生的
资产评估行业,是社会进步,经济发展的产物。现实中,还存在一些矛盾和问题,必须引起重视,切实加以解决。1、"无法立法,立法无法"目前,关于评估立法的呼声很高,关键是,立法应该
新农村的文化艺术建设是当前社会主义新农村建设的重要组成部分,也是推动社会主义新农村建设走向繁荣的基础。但在新农村文化艺术具体建设中也存在一些问题和不足,这些问题影
研究了一类模糊不确定网络切换控制系统的H∞鲁棒控制问题,将时延的不确定性转化为系数矩阵的不确定性,在此基础上利用并行分配补偿,并根据H∞鲁棒控制理论及线性矩阵不等式方法
糖尿病是严重影响人们健康和生命的常见病,其致残率、致死率仅次于心、脑血管及癌症,占第三位。糖尿病患者中,约70%出现全身小血管和微血管病变,糖尿病性视网膜病变(diabetes retin
船舶作为当今世界上重要的交通运输工具,在经济全球化的进程中起着举足轻重的作用。面对日益频繁的海上运输和越来越大的船舶吨位以及全球节能环保的时代要求,从船舶的安全性
在高中语文阅读教学中,教师要指导学生多元解读作品,促使学生提高阅读能力。本文通过举例设置悬念、筛选信息、立足文本、组织实践四种方式,介绍指导学生多元解读,以期得到抛