结合深度特征学习的高效近似重复图像检测算法

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:yuanCL19861125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和多媒体内容的快速发展,互联网上的图像数量呈现爆炸式增长趋势。同文本信息相比,基于视觉信息的图像更加形象、易于理解,这种优势使数字图像应用非常广泛,比如医学图像、新闻图像、商标图像等。互联网上的图像通常呈现这样一种特征:通过使用图像搜索引擎如Google或者百度,我们会发现一幅原始的数字图像经常会有很多近似重复的图像。这种现象造成了互联网资源的巨大浪费,同时也带来了图像侵权等问题。因此,高效的近似重复图像检测(Near Duplicate Image Detection,NDID)算法就显得尤为重要。  本文从结合深度特征学习的哈希编码以及负载均衡的局部敏感哈希(Locality Sensitive Hashing,LSH)索引结构两个方面构建高效的近似重复图像检测系统。主要工作如下:  ①提出了结合深度特征学习的对称层次哈希编码网络。传统的图像特征都属于人工设计的特征,依赖于设计者的先验知识很难利用海量数据的优势,具有很大的局限性。本文的方法既利用深度学习从大量样本自动学习更有效特征的优势,又能够结合哈希编码的模式来训练网络学习更适用于LSH索引结构的特征。相较于传统的CNNH(Convolutional NeuralNetwork Hashing)算法需要大量图像对相似度矩阵用于训练网络,该方法具有训练简单、生成哈希码质量高等优点。该方法的良好性能在网络训练过程及公开数据集CIFAR-10、UKbench的实验结果中得到了验证。  ②本论文提出改进的LSH索引结构-负载均衡局部敏感哈希算法Load Bal-anced LSH,LB-LSH索引结构通过均衡哈希桶,使每个哈希桶含有的样本数量趋于均衡,从而提高NDID问题的检测效率。LB-LSH算法通过对基本LSH索引结构的数学理论分析,在确保检索效率和准确率的前提下得到一个近似哈希桶样本数量阈值。同时,本文结合算法提出了切实可行的高效NDID系统实现。在UKbench、INRIA Copydays数据集上的实验结果表明本文的方法在准确率以及索引效率上优于传统的LSH算法。  ③在构建Coarse-to-Fine两步检测模型时,本文在Coarse-level Search阶段使用工作1对称层次哈希编码网络提取的特征来构建LB-LSH索引结构,在Fine-level Search阶段使用Fine-tuning后的模型提取的特征来计算最终的检测结果。这样将分层的深度哈希编码学习网络与负载均衡LSH结合形成一个端到端(end-to-end)的高效近似重复图像检测系统。
其他文献
先进控制是工业界挖潜增效的主要手段,如何在DCS中发挥出先进控制的最佳性能,如何在新兴的FCS中进行先进控制,这些都是当前需要研究探讨的问题。本文以精馏过程和实验室加热炉温
近年来,随着互联网的迅猛发展和普及,社交媒体已经成为人们获取信息、表达思想以及分享观点和情感的重要平台。社交媒体中用户间的交互行为使得某些用户生成的内容(如讨论帖、微
嵌入式系统是将先进的计算机技术、半导体技术和电子技术与各行各业的具体应用相结合后的产物。嵌入式系统已经成为当前IT产业的焦点之一,但同时大量的嵌入式应用也对嵌入式系
电力电子技术CAI及仿真软件对于《电力电子技术》课程的学习和现代多媒体教学具有十分重要的作用。本课题对该软件进行了较为深入的研究开发,完成了一套完整实用的电力电子技
交通运输是国民经济的命脉,直接影响社会经济、生产与生活的各个方面,与每个人的生活休戚相关。随着城市化进程的不断推进,城市规模不断增大,城市人口越来越多,而分配给交通系统的
摄像机标定是三维重建中的基本问题。自标定方法的灵活性使得它是摄像机标定中的重要研究方向。其中,基于分层重建方法和基于绝对对偶二次曲面方法是较为成熟和广泛应用的自标
本文根据系统科学中有关系统演化的理论描述,充分借鉴和运用系统概念、大系统分解方法、反馈控制思想和动态演化思想,分析风险投资行业从诞生伊始演化为成熟状态的整个过程所遵
视觉主导着人类的知觉系统,是一切行动的重要基础。长期以来,研究者试图赋予人工系统类人的视觉处理能力。视觉识别,特别是图片分类和物体检测一直是研究的重点,是更高级别视觉感
本文将机器学习领域的最新研究进展:支持向量机(SupportVectorMachines,简称SVM)技术,应用于典型的钢材性能预报过程,主要的研究工作及成果体现在以下几点: 1.编程实现了SVM的
天然气是重要的化工原料和方便使用的燃料,其经济价值已经得到人们的普遍重视。天然气流量计量是流体流量计量中最为复杂的一种,它除了具有流体流量计量的综合性、导出性和动