基于主动学习的图像分类与检索

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:a522599301
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数码采集设备、存储技术、及互联网技术的飞速发展,以图像为代表的数字内容迅猛增长,并已经成为人们生产与生活中不可或缺的重要组成部分。然而,面对越来越多的图像数据,用户要想从海量内容中快速找到想要的图像正变得越来越难。因此,如何建立图像的高效索引、并实现准确检索已经成为当前迫切需要解决的问题。  本文主要针对图像数据内容,深入探讨和研究了图像语义属性特征表达以及基于主动学习的图像分类和检索等相关理论和方法。通过分析和挖掘语义属性的跨类别性质以及丰富的网络资源,建立了介于高层类别和底层特征之间的中层属性特征空间;综合考虑了样本的不确定性、多样性和稠密性等样本选择标准,借助用户在相关反馈过程中提供的信息,在标注样本稀少的情形下有效改善了主动学习方法的性能。本文的主要工作和贡献如下:  针对语义属性无法适应不同应用的缺点,特别是在无训练样本图像分类(zero shot learning)任务中欠佳的表现,提出了学习辅助特征空间的方法。通过分析待分类类别里少量训练样本(small shot learning)的底层特征与对应类别之间的关系,我们提出了两种辅助特征学习方法:序列特征学习和判别性特征学习。这两种方法从不同的方面考虑了样本极度缺少的不利条件,深入挖掘类别与底层特征之间的关系,并在此基础上形成了不同的判决性特征的学习方法,提高了图像特征表达的判别力。  针对主动学习初始阶段标注样本稀少的不利条件,提出了一种基于属性特征空间的主动学习方法。传统的主动学习方法中,用户只是简单地提供样本类标,系统对用户标注的样本也只是简单地放入训练样本集中,重新进行分类器的学习,针对这种传统的主动学习模式,利用用户提供的语义属性和大量的网络图像,主动迁移源数据知识建立图像属性特征空间,降低了图像特征的维数和模型的复杂度,从而减少了相关反馈的轮次以及需标注样本的数量,并且有效提高了图像检索的检索准确率。  深入探讨了传统主动学习中三种经典选样标准的融合,提出了一种自适应传播的主动学习方法。本文受图传播方法的启发,提出了一种新的批模式主动学习方法,不仅考虑了标注样本和未标注样本之间的关系,还考虑了未标注样本内部的关系,根据样本数据的非平衡分布和人类的个性化反馈,综合考虑和衡量了样本的不确定性、多样性和稠密性等样本选择标准以及标注样本与未标注样本之间的相互关系,并将这些标准和用户的个性化反馈信息融入当前标注样本的确定度自适应传播函数的参数中,从而有效兼顾了主动学习方法的性能和效率。
其他文献
纳米制造是纳米技术的核心内容之一,纳米制造能力直接反映了纳米技术的发展水平。纳米尺度的焊接加工是实现纳米制造的关键技术环节。本论文的研究内容以国家自然科学基金支持
在自动目标识别领域,通常使用模板匹配方法完成对目标的识别与跟踪,模板的好坏在很大程度上决定了自动目标识别算法的效果,工程应用中,对于建筑物目标,一般使用轮廓线作为模板。本
信息技术飞速发展,带动了工业控制领域的深刻变革,以智能仪表和现场总线技术为基础,逐渐形成了全分布网络集成化的现场总线系统。新一代的控制系统能给最终用户带来更多的便
视觉目标跟踪是计算机视觉领域中的研究热点之一。目标跟踪在智能监控、人机交互、虚拟现实等领域具有广阔的应用前景。经过几十年的研究,目标跟踪技术有了长足的发展,但是复杂
随着互联网业务发展的多样化,传统网络架构面临着前所未有的挑战。而构建全新的网络架构从经济、工程可行性方面考虑显得时机尚未成熟。在这种情况下,网络虚拟化技术被提出并
学位
目前最先进的卫星遥感成像已经接近0.1米的分辨率,然而卫星快速地扫描陆地和海洋时,会产生海量的图像数据,依靠人眼进行判读很难做到实时和无遗漏。因此,遥感图像目标自动检测方
实体关系的语义映射是将自然语言文本中的关系指称项与知识库中的属性关系建立语义关联的技术,是大规模知识库构建、语义搜索等应用的重要支撑技术之一。随着开放式信息抽取研
航天器空间对接是探月三期工程必须首先解决的关键性技术之一。对接机构的可靠性对上升器和轨道器的成功对接起着决定性的作用,因此,为了验证对接机构工作的可靠性,考查空间恶劣
非严格反馈非线性系统具有广泛的实际应用背景,且较严格反馈非线性系统更具普遍性与复杂性。在这些现实系统中,由于人们对过程机理的认识不够完善,从而非线性的结构信息往往不能