结合语义保护和关联挖掘的跨模态哈希检索算法研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:flw00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的高速发展,人们能够轻易地获取到海量的信息,而这些信息的载体也越来越多样,包含了文本、图片、视频和音频等各种形式,这些形式多样的信息便构成了多模态数据。如今,传统意义上的单模态数据检索如以文搜文已经不能满足人们的需求,用户往往希望通过某一种模态的数据检索出更丰富的信息,如以图搜文、音频、视频等。因此,越来越多地研究注意力转移到跨模态检索。由于哈希方法具有存储空间小和计算速度快的优势,这与检索任务的要求十分契合,所以将其与跨模态方法结合起来是十分有意义的。本文结合语义保护和关联挖掘对跨模态哈希算法进行了研究,主要工作包括:(1)本文整理了传统跨模态哈希方法并选取其中具有代表性的四种算法进行分析,运用控制变量的思想,分别对它们从算法框架、回归方法、迭代方法和再生成哈希码四个角度探讨了这些策略对最终检索结果的影响。同时得出了一系列结论,为后续工作提供了指导性意见。(2)本文提出了一种基于三重矩阵分解的跨模态哈希算法。多模态数据中不同模态数据的维度往往并不相同,目前大多数跨模态算法都采用等长哈希码表示它们,但这难免会对其中某些模态的数据的表达精度有所损害。同时,多模态数据中还存在着大量的不成对数据,这部分数据很少被关注。针对这两个问题,本算法利用三重矩阵分解为不同模态的数据学习不同长度的哈希码表达,同时还通过语义关联矩阵为不成对数据学习哈希码表达。实验证明,该算法能够高效地处理各种应用场景:等长哈希码跨模态检索,不等长哈希码跨模态检索,成对数据跨模态检索,不成对数据跨模态检索,单模态检索等。(3)本文提出了有监督一致自编码模型以及一系列的变种模型。该算法使用两个独立的自编码模型来分别为不同模态的数据学习特征表达。同时,通过标签信息的引入,使得所学习的特征更加具有判别性。该算法原本为实值算法,为了将其与哈希算法结合起来,本文尝试性地在隐藏层之上加入了一层哈希层,并取得了一定的效果。(4)针对多模态数据中的不成对数据,本文提出一种三重融合网络哈希模型。不同于以往的双流模型结构,该模型使用融合网络同时处理多模态数据,弥补了双流网络结构中网络之间关联性较弱的问题,实现了同时使用损失函数约束和网络结构挖掘模态间关联性。同时,通过零补全操作的引入,该模型能够同时处理成对数据和不成对数据,还解决了融合网络中常见的主导领域问题。实验证明,该算法能够有效地处理成对和不成对数据集,同时对多模态数据中的成对关系约束也没有过度的依赖。
其他文献
【研究背景】膀胱癌是泌尿系统最常见的恶性肿瘤之一,近年来,我国膀胱癌的发病率逐年升高,而且它是一种没有明显症状,容易复发的疾病。褪黑素是松果体内分泌的吲哚胺激素,之
目的:如今对冠心病的诊断方法有很多,多以冠脉造影作为金标准,横向对比其他诊断方法来评价其对冠心病诊断的临床意义。而心肺运动试验对冠心病诊断的临床意义并不多见,同时关
过去几十年,Web数据随着互联网的迅猛发展不断激增,如何有效地从这些难以计数的Web数据之中挖掘隐藏的、有价值的信息并加以利用,已成为当前数据挖掘领域的研究热点。另一方面,据调研,仅有10%的大学生第一次就业时找到了完全适合自己的工作。这反映了当前高校大学生对所学知识与工作内容的契合度没有充分的了解。而企业也长期存在精准定位招聘人才难,招聘成本高、周期长、效果差,留住人才难、人才沟通难等问题。针对
在数字测试领域,由于测试数据集容量高速增长,单一的数据发生设备很难兼顾各种测试需求,多台设备集成构建超大容量数据集成为发展趋势。在系统集成中,如何高效、快速利用数据发生设备产生测试所需的超大容量数据集,是系统测试效率提升的关键,本文提出的利用多台数据发生设备级联组成数据发生系统的方法,可以有效地解决这个问题。为实现级联模式数据发生系统,本课题从大容量码型数据的压缩、存储、传输以及仪器控制等几个方面
湖南地税发票管理过程中,由于发票开具行为无法得到及时有效的监管,导致虚假发票大量出现,严重威胁税收的征管秩序。近年来,国家税务总局大力推广网络发票的应用,但大量用户
脉冲功率技术的不断进步以及其应用领域的拓展,使得脉冲功率系统对脉冲功率开关的要求越来越高。碳化硅门极可关断晶闸管(SiC gate turn-off thyristor,SiC GTO)是应用在脉冲
软件产品的质量与软件过程密不可分,软件过程为管理软件生命周期过程中难以控制的环节提供了一个框架,在过程模型指导下开发出的软件产品质量的优劣与过程模型的质量息息相关
智能移动机器人作为人工智能发展重要的衍生产品,极大的改变了人类的生产、生活方式。场景识别是针对智能移动机器人研究的一个重要分支,移动机器人的诸多功能如定位、导航、
背景2型糖尿病(type 2 diabetes mellitus,T2DM)是一种可累及全身的慢性代谢性疾病,随着城市化进程加速、人口老龄化、肥胖患病率增加及遗传易感性等问题的凸显,糖尿病发病率
目的:观察姜树民教授之“理气通腑润肠颗粒”治疗肠道气滞型功能性便秘的临床疗效,评估其临床价值,并探讨其作用机理。材料与方法:在2017-10至2019-12于辽宁中医药大学附属医