论文部分内容阅读
随着计算机科学与技术的发展,计算机被应用到各行各业。决策支持系统(Decision Support System,简称DSS)越来越被人们重视,决策支持系统的模型系统也同样受到人们越来越多的重视。早期决策支持系统的模型系统将模型作为数据或子程序存储,并采用类似数据管理的办法对模型进行管理。随着决策问题日益复杂化和支持知识处理的需要,这种简单的模型系统已不能适应新的决策需求。近年来,在模型选择方法和模型选择知识处理等方面取得了一些进展。但因为模型选择是一个比较困难的问题,至今这方面的成果还很有限,绝大多数研究成果还不能实现自动模型选择,而是依靠专家经验进行选择。基于这种情形,研究模型的自动选择具有一定的理论价值和深远的意义。本文对典型决策树分类算法进行研究后,针对规则生成方法对决策树算法进行了改进。在属性的信息熵和信息增益的计算公式中加入一个根据专家的先验知识和领域知识而定义的平衡度系数,将其加权和变为加权和与系数的和,从而可以增加某些属性的信息熵,相应的降低其他属性的信息熵。用改进后的决策树算法建立的决策树比原决策树更紧凑、简单,这不但可以加快决策树的生长,而且可以得到结构比较好的决策树,以便从中挖掘出更有价值的规则信息。文章最后通过建立某大型超市决策模型对改进后的决策树算法进行实例分析,并依据UCI公共数据库中的4个标准数据集为数据源,对建立的决策树模型进行了模拟仿真测试。实验证明,改进算法在基本上不改变原来算法预测精度的基础上,建立的决策树模型更紧凑、简洁。减少了决策者的劳动量,更易于被决策者们所采用。最后总结本次研究所取得的成果,提出不足与待改进的部分,供以后继续研究。