决策树分类算法中C4.5算法的研究与改进

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:michaelwf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
C4.5算法是用于生成决策树的一种经典算法,虽然其有很强的噪声处理能力,但当属性值缺失率高时,分类准确率会明显下降,而且该算法在构建决策树时,需要多次扫描、排序数据集、以及频繁调用对数,针对以上缺点,本文提出一种改进的分类算法.采用一种基于朴素贝叶斯定理方法,来处理空缺属性值,提高分类准确率.通过优化精简计算公式,在计算过程中,改进后的计算公式使用四则混合运算代替原来的对数运算,减少构建决策树的运行时间.为了验证该算法的性能,通过对UCI数据库中5个数据集进行实验,实验结果表明,改进后的算法极大的提高了运
其他文献
随着高等教育制度改革推进,教育经费合理有效地分配受到多方重视,特别是高校预算定额方面,多方学者对其进行诸如拨款模式等研究.通过对文献综述分析发现,目前国内所采用的高
在过程写作法和写作认知的研究背景下,通过分析内容图式在写作过程模型中的体现,综述了内容图式对英语写作过程的影响的相关研究。内容图式的重要性已经在听力和阅读研究中得
目的 探讨膀胱低恶倾向乳头状尿路上皮肿瘤 (PUNLMP)病理特点及临床治疗措施。 方法  2 1例石蜡包埋标本源于膀胱镜活检 16例 ,经尿道膀胱肿瘤切除术 (TURBT) 5例。患者男
本文以现代金融发展理论和经济增长理论为支撑,从县域经济发展与金融支持的关系出发,找到保定县域经济对金融的需求特点,在分析保定市县域经济发展中金融供给特点的基础上,提
利用多媒体课件进行授课已成为当今一种主流的教学方式。多媒体课件具有与传统教学模式无可比拟的优点,但在教学过程中也存在很多的问题。为充分发挥多媒体课件的优越性,扬长
基于国际新一轮科技革命和产业变革、国家层面创新驱动发展战略深入实施、内陆与沿海地区科技成果转化绩效差距明显三大特征,本文重点从科技成果转化各类主体的参与和激励机制
数学阅读是数学学习的重要方法。它在培养学生的问题意识,提高问题解决能力,激活学生的创新思维,涵养数学文化等方面具有重要作用。课程标准明确提出要重视数学阅读,为学生创造数学阅读机会,加强学生数学阅读能力的培养。数学阅读教学需要教师掌握良好的、系统的、可操作的教学策略。调查发现,学生的数学阅读能力亟待提高,部分数学老师仍缺乏系统的可操作的教学策略以指导学生数学阅读。因此,本文以信息加工学习理论为指导,
针对涉外护理班“臀大肌注射”双语教学进行说课设计,满足理实一体化教学要求,激发学生学习兴趣,提高教学质量和学生专业英语水平。
全球价值链(GVC)即产品内分工生产环节跨国分解,各生产环节增加值大小和嵌入位置高低可度量企业(国家)的市场势力和贸易利得。跨国复杂生产协作的实现和生产要素的全球流动,