用Boosting方法组合增强Stumps进行文本分类(英文)

来源 :软件学报 | 被引量 : 0次 | 上传用户：chenhuiww060606

【摘要】

：

为提高文本分类的精度,Schapire和Singer尝试了一个用Boosting来组合仅有一个划分的简单决策树(Stumps)的方法.其基学习器的划分是由某个特定词项是否在待分类文档中出现决定

【作者】

：

刁力力石纯一

【机构】

：

清华大学智能技术与系统国家重点实验室,清华大学计算机科学与技术系北京100084,北京100084

【出处】

：

软件学报

【发表日期】

：

2002年08期

【关键词】

：

Boosting Stumps boosting 机器学习学习样本 stump 问题规模决定基分类器分类能力

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为提高文本分类的精度,Schapire和Singer尝试了一个用Boosting来组合仅有一个划分的简单决策树(Stumps)的方法.其基学习器的划分是由某个特定词项是否在待分类文档中出现决定的.这样的基学习器明显太弱,造成最后组合成的Boosting分类器精度不够理想,而且需要的迭代次数很大,因而效率很低.针对这个问题,提出由文档中所有词项来决定基学习器划分以增强基学习器分类能力的方法.它把以VSM表示的文档与类代表向量之间的相似度和某特定阈值的大小关系作为基学习器划分的标准.同时,为提高算法的收敛速度,在类代表向量的计算过程中动态引入Boosting分配给各学习样本的权重.实验结果表明,这种方法提高了用Boosting组合Stump分类器进行文本分类的性能(精度和效率),而且问题规模越大,效果越明显. To improve the precision of text classification, Schapire and Singer have tried a method of combining Boosting with simple one simple stumps whose division is based on whether a particular item is in the document to be classified It is decided that such a basic learner is obviously too weak, resulting in the final combination of Boosting classifier accuracy is not ideal, and the need for a large number of iterations, and therefore inefficient.To address this issue, all the terms from the document The method that decides the division of learner to enhance the ability of learner classification based on the similarity between the document represented by VSM and the class representative vector and the size of a certain threshold is used as the basis for learner classification.At the same time, The speed of convergence of the algorithm and the weights assigned to the learning samples by Boosting are introduced dynamically in the process of class representative vector.The experimental results show that this method improves the performance (accuracy and efficiency) of text classification by Boosting combined Stump classifier, And the greater the scale of the problem, the more obvious the effect.

其他文献

四逆汤散合桂枝加龙骨牡蛎汤治疗阳虚失眠的临床观察

背景失眠症是临床神经科常见疾病,在神经科门诊占初诊病人主诉的第二位,也是众多疾病的一个伴随症状。临床上的失眠多见难以入睡、夜间易醒多醒、早醒、噩梦、次晨困倦、注意

学位

中医药治疗心理阳虚失眠

高中数学课如何创设问题情境

“以问题为中心,以学生为中心”是新课程倡导的核心理念.中明确指出高中数学在数学应用和联系实际方面需大力加强.教师应创设适当的“问题情境”,鼓励学生发现数学的规律和问

期刊

高中数学问题情境新课程

话谈知识与能力

我们常说“知识就是力量”“知识是人类进步的阶梯”,确实如此,知识使人类进步,知识使人类成为自然界中最强大取得物种,知识把我们引向了科技信息时代,知识使我们拥有了高科

期刊

知识就是力量人类信息时代生活能力高科技自然界物种社会名声阶梯地位

四妙合萆薢渗湿汤对急性痛风性关节炎治疗的实验研究

目的：对四妙合萆薢渗湿汤治疗实验性大鼠急性痛风性关节炎的作用进行实验研究。　　方法：采用二甲苯致小鼠耳廓肿胀实验、醋酸致小鼠扭体反应，将四妙合萆薢渗湿汤分别用于两种模

学位

四妙合萆薢渗湿汤急性痛风性关节炎动物模型镇痛作用

如何培养幼儿的语言能力

幼儿是祖国的花朵,祖国的未来,也是祖国明天的栋深之材.幼儿的词汇量,语汇量,以及对词汇的理解能力和表达能力,直接影响着幼儿以后的学习.从某种角度上说,幼儿语言能力的高低

期刊

培养幼儿语言能力学习兴趣直接影响知识接受小学阶段适应能力理解能力词汇量表达能力语汇学科性格情感角度花朵

浅谈小学低年级口语交际能力的培养

口语交际是现代公民的必备能力.口语交际教学是培养学生口语交际素养的重要途径.在小学低段口语交际教学过程中,教师只有利用语文教学的各个环节有意识地培养学生的口语交际

期刊

低年级口语交际能力培养

广东轻工职业技术学院教师设计作品选

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

清开冲剂治疗急性肝坏死的实验研究

该文通过清开冲剂抗急性肝坏死的实验研究,观察其疗效并探讨其抗肝坏死的作用机制.结果表明,清开冲剂对急性肝坏死有良好的防治作用,其疗效优于HGF.清开冲剂不仅减轻炎性程度

学位

急性肝坏死作用机制清开冲剂中药疗法HGF

平喘灵雾化吸入治疗卵清白蛋白所致哮喘豚鼠的实验研究

目的:观察平喘灵对卵清白蛋白所致哮喘豚鼠的抗气道炎症及抗气道高反应性作用.结论:平喘灵在抗致敏豚鼠气道高反应性方面有较好疗效.

学位

卵清白蛋白哮喘平喘灵氟美松气道炎症气道高反应性

对提高初中化学教学有效性的探讨

有效教学是教学的重要原则,笔者结合多年的教学实践经验,对如何提高初中化学教学的有效性进行探讨.rn1 从学生实际出发,做到“三个方面”rn为了提高初中化学教学的有效性,教

期刊

初中化学教学的有效性学生实际化学学习有效教学教学实践化学知识帮助学生高学生兴趣认识经验教师记忆激发

用Boosting方法组合增强Stumps进行文本分类(英文)

其他学术论文