【摘 要】
:
关系在现实世界中无处不在。在机器学习研究领域,数据中有两类关系不容忽视:1)样本之间的关系;2)标记之间的关系。大量研究结果表明,对这两类关系的合理利用对提升训练模型的
论文部分内容阅读
关系在现实世界中无处不在。在机器学习研究领域,数据中有两类关系不容忽视:1)样本之间的关系;2)标记之间的关系。大量研究结果表明,对这两类关系的合理利用对提升训练模型的预测能力至关重要。基于图的方法是关系利用的一类主流范型。这方面的代表性工作获得了国际机器学习领域十年最佳论文奖。经过十余年的研究,基于图的方法已取得了许多成果。然而,其学习性能严重依赖于图的构建。现实任务中,图构建通常难以有效确定,使得学习性能的鲁棒性不佳,有时还会出现性能的损害。本硕士论文围绕提升关系利用的鲁棒性这一重要问题展开研究,主要取得了以下创新成果:第一,针对样本关系利用对图构建敏感的问题,提出了基于大间隔准则的图质量判断方法。该方法将鲁棒样本关系利用这一难题形式化为经典半监督支持向量机框架。优化上给出高效的求解算法。实验结果表明,该方法显著提升样本关系利用的鲁棒性,有效避免传统方法会导致性能退化的现象。本论文还进一步将大间隔准则拓展用于带噪样本关系,提出了高效学习算法,有效防止带噪样本关系对性能的危害。第二,针对标记关系利用对图构建敏感的问题,提出了基于分类器构圈的标记关系利用方法。该方法通过将分类器以圈形式构建,克服了传统学习方法在标记关系利用中分类器次序对性能的严重影响。论文分析了该方法的时间复杂度与传统方法相当,不显著增加计算开销。实验结果表明,该方法显著提升标记关系利用的鲁棒性,有效避免传统标记关系利用方法会导致性能不佳的现象。
其他文献
本文主要是对核Fisher(KernelFisherDiscrimininantAnalysis,KFDA)的理论和算法展开研究,以更有效的解决大规模样本学习问题。针对核fisher算法的两方面内容展开:一个是KFDA的传
开关磁阻电动机(Switched Relunctance Motor,简称SRM)驱动系统是20世纪80年代迅猛起来的一种新型电机驱动系统,该系统该系统由双凸极式磁阻电机、功率变换器、位置传感器和控制器四部分组成。由于其具有结构简单、运行可靠、系统控制灵活、效率高等优点,目前已成为电机和调速驱动系统研究领域中的一个重点课题。但是,由于SRM磁路存在严重的饱和非线性,所以难于建立易于解析的数学模型。
随着病人对医疗质量和服务水平需求的提高,特别是计算机和网络技术的普及,各种医疗信息系统开始在医院中投入使用,建设数字化医院已经成为当今医院发展的必然趋势。 然而,
近年来,射频识别技术(简称RFID)日趋为人们所热衷,特别是UHF频段的RFID技术,其各方面的优势使之成为未来RFID技术发展的重点。本文以UHF频段RFID读写器系统的设计研究为目的,
伴随飞速增加的带宽、实时和多媒体应用的普及、几乎持续的以指数规律增长的规模,Internet的控制机制和行为特征也日趋复杂和难以理解。由于网络流量数据的特性实际上反映了其
本文探讨了如何在中国科学院范围内对宝贵的科学研究信息进行有效共享问题。尤其是科学数据库信息和众多学者专家所掌握理解的科学研究成果。随着科学院近半个世纪的飞速
文本挖掘是指在大量文本集合中发现有用的模式和知识。作为文本挖掘的重要手段和数据挖掘重要分支的文本聚类对文本的处理、信息检索等领域有着广阔的应用前景。 本文研究
近年来,情绪已经成为人工智能领域中的一个新的研究热点。但已有的工作主要集中在小范围内,对一些典型情绪进行高度抽象化的分析和解释,以及情感计算方面,并没有对于引起特定情绪
线谱频率LSF(Line-SpectrumFrequency)或线谱对LSP(Line-SpectrumPair)是线性预测系数的一种推演参数,是代替线性预测系数量化的最有效的方式。近年来的研究实践表明,LSF是一种
软件体系结构是软件工程领域中发展迅速的一个研究与实践领域。目前,软件体系结构的研究主要集中在静态体系结构上,因此多数软件系统的全局策略是在系统的设计阶段选择确定的。