论文部分内容阅读
数据挖掘是近年来随数据库和人工智能发展起来的新技术,其目的是从大量的、不完全的、有噪声的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识。数据挖掘功能包括概念/类描述、关联、分类、聚类等等。在数据挖掘领域,关联规则挖掘有着广泛的应用背景,它描述数据库中数据项之间某种潜在关系的规则。同时,粗糙集理论对不完整、不精确信息和知识具有很强的分析处理能力,目前已经成为智能信息处理的一个热点研究内容,并已被广泛应用于机器学习、模式识别、知识发现、决策分析等领域。
本文系统阐述了数据挖掘技术的总体研究情况,详细介绍了关联规则的发展现状,研究了粗糙集的理论框架、概念基础以及粗糙集理论的核心--知识约简,简要介绍网络成瘾这一社会问题日益突现,给人们生产生活带来极大影响。
在完备的理论研究的基础上,本文将粗糙集中的决策表引入数据处理中,极大地减少了不一致数据,提高了数据的合理性。将粗糙集理论中的知识约简与关联规则的经典挖掘算法Apriori相结合,缩短了算法的处理时间,克服了算法中的计算量大、对真实数据数据处理速度较慢等的问题。最后将粗糙集的属性约简及数据挖掘中的关联规则应用于网络成瘾问卷调查中,并最终形成网络成瘾问卷调查系统,将数据进行预处理、属性约简、关联规则挖掘、知识挖掘等处理过程,将挖掘出的知识以明确、简单、有效的形式展示。