基于最小最大规则的集成策略研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:fire1977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从二十世纪九十年代起,集成学习逐渐成为机器学习领域的一个研究热点,它是通过组合多个不同弱学习模型,从而形成一个泛化能力更好的强学习模型。集成学习的思想先后被用于分类问题和特征选择问题中,都取得了不错的效果。本文主要是对集成学习在这两个方面应用进行分析和研究,特别关注一种经典的基于最小最大规则的集成策略。本文首先介绍了一种基于最小最大规则的分类集成策略,并针对生物医学领域的分类问题,比较了该集成策略与其它三种常用集成策略在包括医疗图像识别、癌症诊断以及蛋白质细胞定位在内的多个生物医学数据集上的分类效果。实验结果表明:第一,相对于单个分类器,集成学习确实可以有效提高分类性能;第二,Bagging集成策略和AdaBoost集成策略对模型性能的提升较为稳定;第三,随机子空间集成策略在特征维度较高时更具有优势,而当特征选择数较少时,最小最大规则集成策略在多数情况下优于其它三种策略;第四,当选择特征的数量达到一定程度时,模型的性能会保持不变甚至出现下降现象。在特征选择问题中,本文提出了一种基于最小最大规则集成策略的特征选择方法。它通过采用数据划分的方式来提高对大规模数据的处理能力。并将该策略与均值法、投票法、中心点聚类这三种常用的集成策略相比较。通过在现实数据集上的仿真实验,结果表明本文所提出的集成策略在选择特征数较少时具有一定优势。另外,在最小最大规则集成模型的基础上,本文加入了对特征冗余性的分析,采用最大代价生成树的方法来找出具有较强相关性的特征组,并在此基础上剔除部分冗余特征。在人工合成的数据集和现实数据集上的实验结果表明:加入冗余性分析可以在较低的特征空间上获得更好的分类性能。
其他文献
高原低氧、低压、寒冷等特点,使消化系统疾病发病率及病情严重程度高于平原地区,部队在高原地区驻训时常发生消化不良、呕吐恶心、腹泻便秘等胃肠功能紊乱症状,严重者引起器
路基工程中含有盐渍土成分时容易发生融陷、冻胀等病害。为了确保盐渍土路基的稳定性和耐久性,需要对其进行改良。通过研究水泥、硅微粉的改良机理,为应用水泥-微硅粉改良盐
农村金融法制化是当前和今后一个时期持续推进我国农村金融改革的主要命题。农村金融法制化命题包含"什么是农村金融法制化,农村金融为什么要法制化,农村金融如何法制化"三个
随着社会的发展,广西水文站网受工程建设影响问题日趋严峻,给水文测验工作造成较大困难。针对近些年来受工程建设影响水文站的测验方法进行探索、分析和总结,指出几种常用方
课堂考勤系统以智能手机为基础进行设计,该系统采用GPS、人脸识别等技术,采用C/S结构形成系统架构,客户端模块与服务端模块设计以简单快捷为理念,一次激活后,学生只需在规定
结合某深基坑工程案例,分析了土体卸载可能会对桩基产生的影响,并探讨了静载试验、自平衡试验等桩基检测方法的应用,进一步分析了钻芯法、钻孔内水下摄像的方法对桩身缺陷评