基于多标记学习的图像标注算法研究与实现

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:z7120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在计算机技术、数字媒体以及多媒体信息高速发展的大背景下,手机、数码相机等高科技产品已经深入人们的生活,随之而来的是呈爆炸式增长的海量图像信息。因此,如何有效地对这些海量图像进行检索就成为了如今计算机视觉及图像处理领域研究的热点问题。自动图像标注算法为给定图像自动地分配语义相关的关键字信息,目前已成为图像分类、检索的重要方法。大多数的研究把图像标注看做一个典型的多标记分类问题,这使得自动图像标注算法取得了一定的进展,但面对海量的图像数据,它们仍然存在一些问题:一是现实中训练样本不足,二是已标注图像数据集的噪声问题,三是如何使预测的关键字信息准确地反映图像特征。这三个问题已成为限制图像标注算法准确率的重要因素。为了提高自动图像标注算法的准确率,本论文对现有的图像标注算法进行了分类整理和深入分析,在多标记学习的基础上,从结合低秩约束正则项的半监督学习方法以及标签排序这两个角度入手,提出了两种图像标注算法,并且在ESPGame、IAPRTC-12、NUS-WIDE等数据库上验证了算法的高效性,主要的研究成果如下:(1)基于结构化低秩表示的半监督学习框架下的图像标注算法。该方法把不同标签的预测模型融合到一个矩阵中,并且引入了矩阵核范数形式的正则项,以此来获得不同标签之间的相关性以及控制模型的复杂程度。除此之外,该算法通过引入图拉普拉斯正则项来充分考虑在已标注和未标注图像上的局部几何结构。同时,考虑到已标注图像的标签噪声问题,算法引入了一个理想的完备矩阵来自动恢复丢失的标签、更正错误的标签。本文给出了对该算法框架的求解方法,并且在多个数据库中进行图像标注实验,验证了算法的有效性。(2)基于标签排序以及矩阵恢复的图像标注算法。该方法根据已给定图像的相关性对标签进行降序排列,而不再是简单的二值选择,解决了多标记学习中训练样本不足、已标注图像的标签不完备的问题。与此同时,该方法将标签排序模型引入到矩阵恢复问题中,并且考虑了矩阵低秩约束标签相关性,因此在标签空间很大而训练样本数有限的情况仍然可以学习出可靠的标签排序模型。本文对该模型采用了加速梯度优化算法(AGA),并在Core15K、ESPGame、IAPRTC-12等数据库中证明了有效性。
其他文献
中文分词是中文信息处理领域的一项基础性课题,未登录词识别问题又是中文分词的瓶颈问题之一。为了解决中文分词中的未登录词识别效率低下的问题,本文在分析现有未登录词识别
统计机器翻译是自然语言处理领域具有挑战性的前沿课题之一,具有广泛应用价值和重要的商业应用前景。随着网络技术的发展和普及,信息量快速增加,各领域对机器翻译的需求量也
同步自动机是一种特殊的有限状态自动机,在机器人学、工业自动化以及生物计算等方面有重要应用,同步性检测和最短同步字的长度(特别是(?)ern(?)猜想)是同步自动机理论研究的两个核心
目前处理器持续增长的温度已经成为芯片设计的主要瓶颈之一。求解热方程最常用的方法是有限差分法(Finite Difference Method,简称FDM)和有限元法(Finite Element Method,简
作为当今计算机发展炙手可热的技术,并行计算及以其为基础的云计算已经成为了解决大数据量,复杂运算问题的首选方法,越来越多的应用被从单机搬到了云端。并行计算的发展使得我们
随着互联网、多媒体技术以及计算机视觉的快速发展,衍生出了大量的多媒体数据,这些数据多以图像、视频的形式呈现。一方面这些图像充斥于数字网络中给人们提供了丰富的共享资
随着科学技术的发展,XML数据已成为Web上数据表示和数据交换的新标准。XML数据是半结构数据,由于其可扩展性、平台无关性、开放性等特点,在诸多领域得到了普遍应用,如科学计
Ad Hoc网络是一种由多个随机移动节点组成的无中心的,多跳自组织的临时性无线通信网络。它能够快速灵活铺设于某些特定场合,并且能自组织、抗毁性强,即使某些节点损毁或离开
医学图像三维重建是将连续的二维医学断层图像合成为体数据并用三维图像的形式显示出来,以增强医生对器官结构和病灶三维形态的观察和理解,有利于提高临床诊断的准确性。在临
近年来,随着信息交换和信息共享数据量的急剧增加,对信息的安全性的要求也在不断的提高,现有的安全技术也无法满足信息安全的需求。国内外对Internet密钥交换协议的研究和应