基于粗糙集理论不完备信息系统的数据挖掘方法研究

来源 :辽宁工学院 辽宁工业大学 | 被引量 : 0次 | 上传用户:ch3192530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是八十年代初由波兰学者Z.Pawlak提出的一种处理不精确、不确定性知识的数学工具。由于其近年来在机器学习、模式识别、决策分析、过程控制、数据库知识发现、专家系统等领域的成功应用,越来越受到各领域专家的广泛关注。属性约简和规则提取是粗糙集理论的核心内容,研究基于粗糙集理论的属性约简和规则提取方法具有十分重要的理论意义和实际意义。 属性约简和规则提取在信息系统的处理中占据了重要的位置,在信息系统的处理过程中,提出一种高效简便的属性约简和规则提取算法可以极大提高数据挖掘的效率,并得到尽可能符合我们需要的知识。本文利用不完备信息系统的特点及其与经典集合论中相关理论的相通性,将前人所提出的覆盖粗糙集理论进一步发展深化,同时兼顾经典粗糙集理论和经典集合论的优点,提出一种新的基于覆盖粗糙集理论的不完备信息系统中的数据挖掘方法。 论文主要内容包括以下几个方面: (1)分析了粗糙集理论的研究现状,并对各种方法的优缺点进行了比较; (2)针对信息系统的属性约简和属性值约简提出了一种基于覆盖粗糙集理论,利用最大一致块技术进行信息系统约简的算法。该算法首先利用william Zhu提出的最大一致块技术对原始信息系统进行属性约简,去除冗余属性,然后在此基础上利用覆盖粗糙集理论对信息系统进行属性值的约简。实例表明该算法简单易行,并能极大程度的去除原始信息系统中的冗余信息,从而得到尽可能简化的信息系统,以简化后继的规则提取工作。 (3)在规则提取部分,首先利用前面所提到的属性约简和属性值约简技术去除决策表中的冗余信息,从而得到最简的决策表。同时,提出“基本规则集”的概念,并利用覆盖粗糙集的相关理论证明决策表中的所有规则都可以由基本规则集得到。
其他文献
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。人们希望将这些数据转换成有用的信息和知识,以便更好地利用这些数据,给决策制定提供数据支持
论文系统阐述并实现了一套 WEB 文本分类的技术。主要技术包括 WEB 文本收集、WEB 文本预处理、处理后的 WEB 文本的中文分词、预抽取训练样本及使用 SVM 方法进行文本训练和
人脸识别是所有的生物识别方法中应用最广泛的技术之一,同时也是模式识别和计算机视觉领域中一个非常具有挑战性的重要课题。人脸识别的方法有很多,其中神经网络可以通过自训练
计算机网络技术的日益成熟为远程教育的发展带来了新的机遇。Web为非实时的远程教育提供了一个优秀的平台,基于Web的远程教育因为其学习方式灵活、客户端使用简单而得以广泛推
办公自动化是现代化办公的趋势。通过采用现代工具和现代作业方式,它可以极大地提高工作效率。如何充分利用Internet网在高校建立起现代化的办公自动化系统,成为了一个需要深
屏幕内容指的是电子设备的桌面生成的视频或图像。随着电子设备的迅速普及和发展,屏幕内容在云计算,远程桌面,屏幕传输等众多多媒体领域发挥着越来越重要的作用。与自然图像不同
J2EE以其规范的开放性、机制无关性、较好的可移植性、可扩展性以及多层分布式计算等诸多优点,正被越来越多地应用到多个领域的信息化建设工程中来。本论文所研究的劳动保障系
笔式用户界面(Pen-based User Tnterface,PUT)遵循纸笔(paper/pen)隐喻,其设计目标是从交互设备到交互方式都模拟人们已经熟悉的纸笔工作方式,同时又充分利用电子计算易于复
目前,政府机构改革的不断深化,国家机关的管理职能不断增强,传统办公方式与不断增长的办公业务量之间的矛盾日益尖锐。因此,改革传统办公模式,开展电子政务,将办公业务的处理
支持向量机算法(SVM)是以统计学习理论(SLT)为基础的一种模式分类算法。由于其具有良好的计算有效性(Computational Efficiency)、健壮性(Robustness)和统计稳定性(Statistic