基于样本差异的多标签迁移学习

来源 :重庆大学 | 被引量 : 0次 | 上传用户:wangeryan8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签学习是机器学习的重要组成部分,在现实生活中有很多应用。分类器评价标准是衡量分类器好坏的重要指标。常用的多标签分类器评价标准有Hamming loss、One-error、Coverage、Ranking loss和Average precision。多标签分类器对测试样本进行分类预测的时候并未给出分类结果的评价标准。通常需要标记测试样本才能够得出标价标准值,然而标记测试样本有时候代价昂贵。那么是否可以不标记测试样本就能得出多标签评价标准值呢?本文围绕这一问题,分别从样本分布差异和样本实例间差异对多标签评价标准进行估计。从实验结果可以看出,训练样本和测试样本的分布差异和多标签评价标准都具有良好的线性关系;训练样本和测试样本的实例间差异和多标签评价标准也都具有良好的线性关系;针对不同的评价标准,相关性程度也不同。分析这两种方法的特点,之后结合样本分布差异和样本实例间差异对多标签评价标准值进行线性拟合估计。实验表明,这三种多标签评价标准估计方法具有良好的效果。迁移学习是机器学习的研究热点,在实际生活中的应用越来越广泛。负迁移现象是迁移学习中不可避免的话题。迁移学习的效果取决于源域样本和目标域样本的相似性。当源域样本和目标域样本的相似性较小时,迁移学习的效果可能不好,甚至会发生负迁移现象;反之,则发生正迁移。本文从样本分布差异和样本实例间差异考察源域和目标域的相似性,然后考察迁移学习的效果。实验表明,当源域样本集和目标域样本集的分布差异较小时,易发生正迁移;否则,易发生负迁移;当源域样本实例和目标域样本实例间的差异较小时,易发生正迁移;反之,易发生负迁移。有关多标签学习和迁移学习的综合研究还比较少。本文对单标签迁移学习算法TrAdaBoost算法进行改进,将其应用到多标签学习领域。实验表明,改进后的TrAdaBoost算法效果良好。然后,再根据源域样本和目标域样本的分布差异和实例间差异考察源域和目标域的相似性对多标签迁移学习效果的影响。实验表明,多标签迁移学习的效果与源域和目标域的相似性跟单标签迁移学习的效果与源域和目标域的相似性一样。
其他文献
本文提出了打结不变的命题投影时序逻辑,介绍了基于该逻辑的模型检测方法,并采用该方法验证了无条件安全通信协议。命题投影时序逻辑(PPTL)可表达所有ω-正则式其表达能力强
随着现代科学技术的发展和社会交通量的日益增大,智能交通系统的重要性日益突出。而车牌自动识别系统(License Plate Recognition System)是智能交通系统中的重要组成部分,它
入侵检测作为一种主动防御技术,弥补了传统安全技术的不足。但由于入侵手段的复杂性和多样性,至今仍然没有找到入侵行为与网络连接信息数据特征之间的函数关系,机器学习正是
实践证明,元启发式已经成为解决多目标问题(Multiobjective OptimizationProblems, MOPs)的有效手段。特别是进化算法的广泛使用,使得大量的优秀算法被设计出来,如NSGA-Ⅱ,SPEA2,P
随着计算机信息处理能力的增强,数字图像处理技术飞速发展并在国民经济的各个领域得到广泛应用。对图像处理中的算法进行合理分类并灵活组合以达到应用需求就显得尤为重要,因
近年来,随着计算机通讯技术的迅猛发展,手机的应用逐渐深入到人们的日常生活中,手机对人们学习和工作的重要性不言而喻。可是由于种类繁多的手机具有软硬件上的差异性,就使得
随着信息技术的发展,人类对信息的需求越来越丰富,多媒体信息已成为人们获取信息的主要载体。视觉信息具有直观、生动的特点,人类通过视觉获取的信息量约占总信息量的70%左右
虚拟现实技术是一项综合性的信息技术,虚拟现实就是在计算机上把现实世界真实的模拟出来,让人从感官上有一种身临其境的感觉。它涉及到计算机图形学、计算机仿真、人工智能等
随着无线通信技术、传感技术及传感器硬件技术的不断发展,无线传感网络在各个领域的应用更加广泛,作用也更突出。近年来,无线传感网络广泛的应用在了各种领域,比如环境监测、
基于Web的分布式网络管理是当前网络管理的一个重要发展方向。与此同时,网络管理的功能由传统的网络设备管理向主机及网络应用管理的延伸也是当前网络管理的研究热点之一。本