【摘 要】
:
半监督学习技术试图利用未标记数据来辅助提高学习系统的泛化能力,已成为当前机器学习的研究热点之一。
协同训练是半监督学习领域的一种主流风范。标准协同训练算法需
论文部分内容阅读
半监督学习技术试图利用未标记数据来辅助提高学习系统的泛化能力,已成为当前机器学习的研究热点之一。
协同训练是半监督学习领域的一种主流风范。标准协同训练算法需要使用充分冗余且条件独立的双视图,由于真实世界问题通常只存在单视图,因此研究者们提出了多种有效的单视图协同训练算法。然而,以往关于协同训练的理论研究都假设问题域存在双视图,这就使得它们难以为单视图协同训练算法提供理论支撑。另一方面,一些研究者在协同训练过程中将半监督学习与主动学习结合取得了很好的效果,但这样的技术也缺乏必要的理论支撑。
本文针对上述问题进行了理论研究,主要取得了以下创新成果:
第一,揭示了双视图并非协同训练的必要条件,所证明的相关定理表明,只要两个学习器具有较大的差异,协同训练就可以有效进行。这一结果不仅为有效的单视图协同训练算法提供了理论支撑,还使得今后对协同训练的理论分析不再需要依赖双视图假设。
第二,从理论上解释了协同训练进行到一定轮数后就不能再继续提高泛化能力的原因,并基于所证明的相关定理产生了一个可对适当的训练轮数进行粗略估计的方法。这一结果不仅弥补了以往理论研究与实验观察之间的间隙,还为适当训练轮数的估计打下了基础。
第三,对主动半监督协同训练进行了理论分析,所证明的相关定理显示出,在协同训练风范下将半监督学习和主动学习相结合会使得样本复杂度显著降低。这一结果的基础是对协同训练风范下主动学习算法所进行的理论分析。
此外,本文还对适用于Internet环境的Aggregagative Learning进行了理论分析。与协同训练相似,该算法也通过使用多个学习器获得了良好的性能。
其他文献
入侵容忍是美国DARPA所提出的“第三代安全”概念中的核心技术。实施它的目的是:当系统受到重大打击时,系统仍能维持关键信息和关键服务的完整性、机密性和可用性。 门限密
本文介绍了实际软件项目中优化问题的基本理论,方法和问题分类,以及优化问题的各种数学模型,比较了各种模型的特点,同时通过对多个实际软件项目的优化研究基础上,讨论了算法优化,数
随着信息获取、处理和传输等技术的不断发展,我们可离线重构地球上城市和海洋等复杂环境的三维数字模型,并将各种实时获取的动态信息接入该虚拟环境,形成与现实物理世界相对应的
SIP是下一代网络中的核心协议之一,用于建立、修改和终止IP网上的多媒体会话。SIP协议因其可扩展性、灵活性、互操作性、可重用性有很广泛的应用领域。但是基于TCP/IP网络的SI
数据可视化环境能够对科学研究中产生的数据通过图形的方式进行展示,便于研究人员对于数据内部包含的信息进行探索和研究。随着计算机技术和工业技术的飞速发展,人们获取信息的
移动多媒体消息业务是基于无线GSM网络之上,能提供多媒体信息实时传送的通信增值业务。但目前该业务本身及其所依赖的无线网络和分组数据网络存在着诸多自身的安全问题阻碍了
随着无线网络应用的日益普及,复杂的语音、数据、视频等多媒体业务的不断涌现,无线网络的用户量急剧增加。由于各类无线网络所能提供的业务类型和传输能力差异极大,如何将类型各
随着Internet的快速发展,网上信息资源越来越丰富,网络已经成为人们获取信息的重要途径。但因Internet所固有的开放性、动态性与异构性,又使得用户很难准确快捷地从WWW上获取所
近半个世纪以来,随着计算机科学和新兴交叉学科的迅猛发展,人们对混沌现象在自然科学领域和社会科学领域的表现有了更深刻的认识,使得对混沌的研究迅速渗透到各个领域。混沌
无线传感器网络综合了传感器、嵌入式系统和无线通信等技术,具有广泛的应用前景。采集语音、图像、视频等多媒体信息的多媒体无线传感器网络是当前的研究热点之一。
本文