论文部分内容阅读
数据库知识发现是当前人工智能研究中较为重要的一个领域,关联规则挖掘是数据挖掘中应用最广的。传统的Apriori算法能产生所有的关联规则,但数量庞大,冗余度高。Wille等在1982年提出的概念格是进行数据挖掘和规则提取的一种有效工具。在传统概念格上,本文设计了一个提取关联规则的算法。该算法并不是提取所有的规则,而是提取规则集中的一个子集,称为组规则产生集。与所有规则的集合相比,它的规模大大减少了,相应的挖掘效率提高了,但是从中仍可推出所有满足要求的规则。与传统的概念格上提取规则算法相比,该算法最终不生成每个规则的支持度、信任度,仅生成满足最小支持度、信任度的所有规则,但规则产生集的规模更小了,对于大型数据库中的低信任度挖掘情况(规则数量多)可产生较少的规则产生集。这样,提供给用户的是较少的而且是容易理解的规则的集合,用户可以根据自己的兴趣有选择地从产生集中推导出他需要的规则。存储规则所用的存储空间小,同时可提高推导规则时查找规则的速度。在产生组规则产生集的基础上,本文给出了一种存储组规则产生集的数据结构和用该用组规则产生集推导出一般规则产生集的算法;同时根据系统需要设计了基于学生成绩类数据库进行挖掘的关于项集的确定方法、从规则产生集中得到单一后项规则的算法。本文使用改进的基于概念格的关联规则提取算法建立计算机专业课程分层次教学模型,确定相关课程对专业课程学习能力的影响权重,设计基于计算机应用技术专业的分层次教学分析系统。为职业院校在专业课程中推行分层次教学提供决策依据。