【摘 要】
:
机器学习的蓬勃发展使得人工智能的研究迎来了新的春天。分类任务是机器学习最核心的任务之一。贝叶斯网络分类器(Bayesian Network Classifier,简写为BNC)凭借其训练成本低而分类精度高、可解释性强、可直接处理多分类问题等优点一直以来都是分类技术领域的研究热点。朴素贝叶斯(Naive Bayes,NB)是最早提出的BNC,它假设在给定类变量的条件下,特征之间相互独立。然而,在特征
论文部分内容阅读
机器学习的蓬勃发展使得人工智能的研究迎来了新的春天。分类任务是机器学习最核心的任务之一。贝叶斯网络分类器(Bayesian Network Classifier,简写为BNC)凭借其训练成本低而分类精度高、可解释性强、可直接处理多分类问题等优点一直以来都是分类技术领域的研究热点。朴素贝叶斯(Naive Bayes,NB)是最早提出的BNC,它假设在给定类变量的条件下,特征之间相互独立。然而,在特征关系复杂的实际问题中,NB的条件独立性假设往往因过强而难以成立,影响了它的分类精度。树增广的朴素贝叶斯(Tree-augmented Naive Bayes,TAN)放松了NB的条件独立性假设,允许特征之间存在一阶依赖关系。k阶依赖BNC(K-dependence Bayesian Network Classifier,KDB)则更进一步,将特征之间的依赖关系扩展到了k阶。使用集成学习往往能大幅提升BNC的分类精度。机器学习领域中主要有两种集成方法:子模型独立训练的并行集成与子模型训练互相影响的序贯集成。加权的平均TAN(Weighted Averaged TAN,简写为WATAN)就是BNC并行集成的典型代表。多阶段分类是序贯集成方法的一种。它将分类器按照模型的复杂程度串行排列。后续分类器负责修正其前驱的分类结果。这样经过反复完善逐级优化形成最终的分类决策。因多阶段分类具有计算开销小、对精度提升显著、可灵活组合分类器等优点,被广泛应用于多个领域。为了纠正BNC当存在类标签的后验概率与最大后验概率接近时可能发生的误分类以提升BNC的分类精度,本文提出了类标签驱动的多阶段贝叶斯网络学习框架(Multistage Bayesian Network Learning Framework Using a Label-Driven Approach,MBLF)。MBLF将测试实例的分类流程扩展为了三个阶段,即预处理阶段、标签过滤阶段与标签专攻阶段。在预处理阶段,一个BNC被用作通才分类器为所有类标签估算后验概率。若存在多个高后验概率的类标签,则使用后两个阶段为该测试实例重新分类。标签过滤阶段首先除去低后验概率类标签,然后使用来自高后验概率类标签的可靠信息重新学习网络结构,将通才分类器升级为优化的通才分类器。标签专攻阶段针对每一个高后验概率类标签都学习了一个专家分类器以充分表达不同类标签场景下的特征依赖关系。最后,通过将专家分类器与优化的通才分类器并行集成获得最终的分类结果。本文将MBLF应用于TAN上得到了类标签驱动的TAN(Label-driven TAN,LTAN)。在40个UCI数据集上进行的实验结果表明,LTAN的分类精度不仅显著优于经典的单结构BNC,而且比一些广受认可的集成BNC更胜一筹,更重要的是,这种精度提升没有带来过多的计算开销。从而证明了MBLF能有效地提升分类精度。
其他文献
本文主要研究了特征p>2的代数闭域上无限维Cartan型模李超代数W和S的阶化模.利用伸张及混合积实现的方法,确定了无限维模李超代数W和S的阶化模.进而,讨论了这两类模李超代数
本文主要研究是正规阵(AA*=A*A),Ep-阵(AA+=A+A),k-广义投影算子(Ak=A*)及k-超广义投影算子(Ak=A+)的性质,其中前两类特殊矩阵已经有许多作者对它们的性质进行了研究,我将从
“学思践悟”是学习“四史”的方法路径和基本要求。其中,学思结合,要从弄懂基本史实和把握历史规律着手,避免历史学习的简单化与纯粹概念化倾向,扎扎实实弄通基本史实、明晰“四个选择”,旗帜鲜明地反对历史虚无主义;参与实践,就要在实践中运用和体会“四史”学习的成果,在实践中发扬党的革命精神,彰显党的优良作风,传承党的使命意识与担当精神,创造性地运用党的工作方法。“四史”学习的目的和方向是领悟马克思主义中国化的最新成果,坚定人民立场与党的领导,深刻认识“八个明确”与“十四个坚持”。学思践悟,不是四个孤立的环节,而是
工业不断发展造成了空气中的非球形粒子污染物不断增加,这些非球形粒子污染物对光电探测和光电通信造成了很大的影响。因此人们需要对非球形介质中偏振传输规律进行研究,利用
在日益激烈的竞争环境下,高效的车间调度对生产制造企业愈发重要,逐渐成为影响企业竞争力的关键因素。开放车间调度问题是众多生产调度问题中的一种,属于调度研究和运筹学领
自然光在传输过程中会由于介质的散射产生偏振光,偏振作为光的一个重要属性,其中携带了目标丰富的信息。非球形粒子的光散射是十分重要而又复杂的,一直是国内外微粒光学特性
图论作为数学的一个新兴分支,虽然只有200多年的历史,但在各个领域都有着广泛的应用,受到了数学界与其他科学界的重视.本文主要考虑了两个问题:最大度为3的简单图和系列平行
习近平在党的十九大报告提出中国特色社会主义进入了新时代,我们党一定要有新气象新作为,党建思想也必须要跟上步伐。习近平的反腐思想作为全面从严治党里的重要组成部分,在
随着面向对象编程OOP(Object-Oriented Programming)技术的快速发展,面向对象软件OOS(Object-Oriented Software)应运而生,其可靠性和质量问题一直倍受用户的关注。随机测试RT(Random Testing)作为一种常用的软件测试方法,其测试效果并不是十分理想。基于此,T Y Chen等人在改进RT的基础上提出了自适应随机测试ART(Adaptiv
1929年的世界性经济危机,日本侵华以及国内政治经济混乱导致统制经济政策成为当时国民政府首选的经济政策。世界性的经济不景气自然影响到众多产业发展,作为四川省重要生产事业——蚕丝业也受到波及,国际市场的丝价暴跌,使国内市场的丝价和茧价下降,养蚕农民家庭的收入也因此减少。1931年以后,在内外交困中四川蚕丝业跌落低谷。在四川省建设厅成立之后,为了以国家的力量拓展生丝的外销,间接促进农村蚕桑业的复兴,四