集成学习结构多样性研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:lw4564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习是一类著名的机器学习方法,通过构建并结合多个学习器来完成学习任务,常可获得比单一学习器显著优越的泛化性能,在诸多实际应用中取得了成功。学习器之间的多样性是构建集成学习模型的一个关键因素。如何理解和度量多样性是集成学习中非常基础但尚未解决的问题。本文对集成学习中多样性进行了研究,主要取得了以下创新成果:1)提出了结构多样性概念,为集成学习多样性研究提供了一个新方向。以往的多样性度量仅考虑分类器预测行为的差异,而忽视了分类器本身结构之间的差异。本文针对决策树提出了一种结构多样性度量,并通过实验验证了其效用。2)提出了一种嵌入结构多样性的新型选择性集成学习算法DRSE(Di-versity Regularized Selective Ensemble)。该算法的基本思想是同时考虑集成误差、行为多样性和结构多样性,使用DCA算法求解。实验结果表明,该算法的性能显著优于现有选择性集成算法。3)提出了一种基于联结树的多元信息多样性(multi-information diversity)估计方法。多元信息多样性基于信息论来刻画集成多样性,其面临的困难是高阶信息通常难以估计。本文方法通过联结树来进行高阶信息估计,实验结果表明在同阶近似下,本文方法优于现有方法。
其他文献
说话人语音提取是说话人语音分离领域中的一部分,有监督学习的情况下,针对从单声道观测语音信号中提取目标说话人语音,本文提出了基于注意机制的说话人语音提取算法,该算法充
核辐射场景中充满放射性粒子,不仅人类无法直接操作甚至相机等多种传感器也会受到影响。图像处理的发展已经越来越成熟,能够从时域和频域去除图像采集的噪声,但无法将环境信
污水处理厂VOCs排放问题正逐步得到重视,关于碳源和碳氮比对污水厂VOCs排放的影响尚未明晰。通过人工配水、SBR装置以脱氮除磷方式运行,研究曝气阶段对VOCs排放的影响,以及有
能源和环境问题已成为当今世界发展的重要议题,作为节能环保代表,电动汽车以其低污染零排放和较低使用成本等优势倍受广大消费者的青睐。作为电动汽车的主要动力来源,动力锂
城市化过程及其对生态系统的影响是地球生物化学过程研究的重要内容,随着全球城市化的迅速发展,城市生态系统的研究日益受到关注。城市化过程引发的大面积土壤封闭,导致土壤
本文围绕三峡库区香溪河浮游病毒时空分布规律及其感染特性,开展相关研究如下:1.浮游病毒裂解率测定方法目前改进的梯度稀释感染法(the modified dilution approach)是测定浮
随着社会的不断发展,人们对传感器的需求日益增长。光纤传感器具有体积小、灵敏度高、抗电磁干扰强以及耐腐蚀性强等优点,在能源、医疗、国防和大型基础设施领域得到广泛的应
耐磨镶圈是内燃机镶圈铝活塞环槽的构成部件,对于提升活塞的耐磨性、提高内燃机的动力性能、减少汽车尾气排放具有重要意义。当前耐磨镶圈生产过程中的筒体铸造环节人工参与
神经网络作为人工智能的核心已经被广泛应用于信息处理、生物医学、智能控制等领域。然而,随着社会信息需求量的不断增长和处理任务复杂度的不断提高,研发功能更多和计算能力
再生制动是电动汽车重要的工作模式之一,是一项关键的节能技术,能够实现制动能量的回收利用,对解决当前电动汽车续驶里程短,蓄电池容量小具有重要的现实意义,从而进一步实现