论文部分内容阅读
近年来,随着数据库技术的迅速发展以及数据库管理系统的广泛应用,企业的数据库中积累的数据越来越多。然而激增的数据背后隐藏着许多重要的信息,想要把所有的信息都进行分析和挖掘,是不明智也是不必要的。我们着重要做的,就是找到合适的算法,约简冗余的知识,提炼重要的数据。Rough集理论是由Pawlak教授于20世纪80年代初提出的一种用于处理不确定性和含糊性知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。它无需提供相关数据集合外的任何先验信息,适合于发现数据中隐含的、潜在有用的规律,即知识,找出其内部数据的关联关系和特征。近年来,Rough集理论和应用取得了很大的成功,已成为软计算方法的重要分支。本文的主要研究工作如下:首先,本文介绍了Rough集理论的基本情况、Rough集的基本概念和Rough集模型的扩展。其次,对Rough集理论的数据约简进行了进一步的研究,提出了一种不一致决策表的划分方法;接着结合概率统计知识对不一致决策表进行决策规则提取,该方法是在满足决策规则力度、肯定因子和覆盖因子的基础上对规则进行筛选,从而提高了决策的准确性和合理性;随后根据Rough集的属性重要性和约简理论提出教学质量的综合评价方法,它解决了教学质量评价指标的约简以及各评价指标权重的确定的问题。该方法有效消减了指标体系规模和削弱了设置权重的主观性。最后,将Rough集约简理论与神经网络进行结合,给出Rough集神经网络约简模型以及该模型的应用。