基于反向预测的零样本学习

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：JK0803yaohai

【摘要】

：

受益于计算能力的提升和大数据时代的到来,机器学习在计算机视觉和语音识别等领域已经取得了显著的成果。但随着机器学习的发展,人们已经不再满足于只处理数据量大的、有监督

【作者】

：

鲁亚男

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2018年期

【关键词】

：

迁移学习零样本学习直推式学习归纳式学习语义表示多类分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

受益于计算能力的提升和大数据时代的到来,机器学习在计算机视觉和语音识别等领域已经取得了显著的成果。但随着机器学习的发展,人们已经不再满足于只处理数据量大的、有监督的问题,小样本甚至是无样本的学习问题提上日程。因此,如何充分的利用已有的知识来帮助无样本情况下的学习,具有重要的研究价值和意义。本文主要是从零样本学习出发进行研究。具体来说,本文分别在直推式和归纳式两种设定下对该问题进行了研究。零样本学习可以看作是迁移学习的一种,它通常包含源领域和目标领域两部分数据。前者含有大量的有标记的训练样本,而后者则没有标记信息,且与前者包含不同的标签集。目前,零样本学习还是不能摆脱对其它模态信息的依赖,比如:由人工标注的属性构成的语义空间。通过使得源领域中的已知类和目标领域中的未知类共享语义空间,人们可以构建它们之间的联系。为了解决零样本学习问题,已有的方法大多是基于投影的方法,它们在训练阶段利用源领域上的监督信息学习将样本和类表示到一个共同空间的投影函数,在测试阶段则先将测试样本和类投影到指定空间,再通过最近邻等方法计算出与每个样本距离最近的目标类,最终得到每个测试样本的标记。但这些方法通常存在一些投影领域偏移和Hubness问题。且由于它们在预测的时候采用了分两阶段进行的策略,因此会存在一定的信息损失。不同于这些已有的方法,本文提出从反向预测的角度来解决零样本学习问题。根据目标领域中无标记的样本在训练阶段是否可用,可以将零样本学习大致分为两类:直推式零样本学习和归纳式零样本学习。在直推式零样本学习的设定下,目标领域中的无标签数据是可用的。本文提出的RevTZSL模型通过同时考虑源领域和目标领域中的信息来帮助已知类和目标类之间的知识迁移,并利用反向预测原理从样本对应的类标签反向的推断出视觉特征,以此来加速对未知类的判别,有效避免零样本学习中的投影领域偏移问题和Hubness问题。而在归纳式零样本学习的设定下,目标领域中的无标签数据在训练阶段是不可用的。针对此问题,本文的主要做法是通过在源领域上采用反向预测的方法学到一个类似于简单的自编码器的模型(RevIZSL),使其具有足够好的鲁棒性,从而在目标领域上具有很好的扩展性。另外,值得一提的是,本文提出的两个模型在测试阶段都仅仅通过一步就可以完成对测试样本标签的预测。为了验证提出的RevTZSL和RevIZSL模型的有效性,本文在3个标准的零样本学习数据集和一个细粒度图像分类的基准数据集上分别进行了实验,测试了这两个算法的分类准确度。实验结果表明提出的算法在4个数据集上与当前最优的算法相比都具有明显优势,尤其是在细粒度图像分类上的绝对优势验证了提出模型的判别能力,另外,通过对RevTZSL和RevIZSL的参数敏感性和收敛速度进行分析,也进一步验证了本文提出的交替优化算法的有效性。

其他文献

RFID系统的数据传输优化与安全技术研究

在RFID系统的无线网络中,数据传输的性能可以用效率和安全两个方面的性能指标来衡量。效率方面的性能包括传输成功率、传输能耗、单位时间数据传输量等等,安全性能指示了传输

学位

RFID数据传输优化数据传输安全防碰撞算法安全漏洞扫描

基于可重构的语音识别片上系统的设计

近年来,嵌入式系统的语音识别系统已经广泛应用到智能家居、工业控制、移动终端等领域,正改变着人们的生活。由于语言交流是人们之间最自然的交流方式,基于语音识别的人机交

学位

GMMHMMMFCCZYNQ7000

基于Elman神经网络的组合需水预测方法研究

随着社会科技的发展，工业化和城市化不断深入，人类对水资源的需求将会维持一段较长时间的增长，但是由于全球气候变化，可供人类使用的水资源逐渐减少，这就导致水资源供需矛盾更加尖

学位

城市供水需水预测Elman神经网络遗传算法

基于移动终端的教学直播系统的研究与实现

随着计算机技术、网络技术和移动终端的长足进步,很多教育研究者将移动终端和在线教育相结合,产生了新的学习方式—移动学习,这已经被很多的学者和高校所接受,相关产品也如雨

学位

移动学习iOS数学学习视频直播电子白板

基于视觉信息融合的驾驶员疲劳检测技术研究

随着经济发展，全世界的汽车保有量已经突破10亿辆，这表示平均每7个人就拥有一辆汽车。因此交通事故的发生也越来越频繁，据统计，造成交通事故最主要的三大原因是酒后驾驶，超速驾驶

学位

信息融合人眼定位疲劳检测AdaBoost

带宽可变的弹性光网络路由频谱配置机制与算法研究

从光纤通信商用伊始,多媒体业务迅速发展,对网络带宽的需求急剧增加,而频谱资源有限,促使光纤通信放弃粗放式的资源利用方式,不断寻求高频谱效率的网络架构。而当前波分复用(

学位

弹性光网络集中式配置自适应分布式子载波配置RSA算法T-RSA算法ASD-RSA算法

基于堆叠系统业务不中断升级的设计与实现

随着网络技术的迅速发展、业务范畴的不断拓展，通信设备更新版本的节奏也越来越频繁。软件版本在线升级与维护方式已成为网络“永续性”环境下提供新特性、修改新缺陷最现实的

学位

堆叠系统ISSU升级系统升级优化不中断转发技术

基于智能手机的呼救系统的设计与实现

移动互联网终端是一种非常新颖的手持网络终端,用户可以利用自己的手机、PDA(Portable Digital Assistant)或者其他的手持设备连接上互联网。从AT互联网研究所最近的一次研究

学位

Android加速度传感器声音识别手机定位求救

基于回归预测算法的无线传感器数据融合节能算法研究与实现

随着微机电系统（MEMS）技术与低能耗、低成本数字信号处理器（DSPS）及无线收发（RF）电路这三方面的高度集成，高效、廉价的传感器网络的可行性得到了提高。这为无线传感器网络的应用与推

学位

无线传感器网络回归预测节能

基于PERL的C/S架构服务器监控系统

随着全球网络通信技术的发展与普及，互联网已经成为人们生活中不可或缺的一部分了，它能够满足人们日趋多样化的需要，如：阅读新闻、社交、娱乐、工作等。B/S架构的产品种类迅速增

学位

互联网应用C/S架构监控服务器告警

基于反向预测的零样本学习

其他学术论文