粗糙集及其在KDD中的应用研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:mzl521fnn1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集(Rough Set,RS)理论是一种刻划不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。RS理论是由波兰学者Plawlak.Z在1982年提出的。1991年Plawlak.Z发表了专著《Rough set:Theoretical Aspects ofReasoning about Data》,系统全面地阐述了RS理论,奠定了严密的数学基础,从而掀起了粗糙集的研究高潮。该书与1992年出版的RS理论应用专集较好地总结了这一时期RS理论与实践的研究成果,促进了它的进一步发展,现已成为学习和应用RS理论的重要文献。从1992年至今,每年都召开以RS为主题的国际会议,推动了RS理论的拓展和应用。目前RS理论已引起了越来越多的科研人员的关注。粗糙集理论的应用和其算法的研究,是近年来知识发现、数据挖掘领域的一个热门话题。粗糙集当中有一个核心问题就是约简,所以,有关约简算法的研究也有很多,但无论是A.Skrown的分辨矩阵还是Pawlak的原始算法,都是从属性的约简开始的。本文通过分析决策表约简规则的本质,提出了一种属性值的直接约简算法,并通过一个商场的购物决策行为验证了我们的算法的正确性,从而简化了约简算法的步骤。经典粗糙集是基于不可区分关系,即等价关系的。事实上,在实际应用中由于所处理的数据不完整,也就很难满足等价关系这一条件。而相似关系是一种普遍存在的关系,所以,用相似关系来代替经典粗糙集的不可区分关系是一种自然的推广方式。本文立足于应用,进一步分析了经典粗糙集在实际应用中的缺点和局限性以及Roman slowinski和Daniel Vanderpooten提出的一种称之为ε-indiscernibility的算法所存在的潜在决策风险,并就此,对前ε-indiscernibility算法进行了改进,增强了这一算法的适应性,从而降低了决策者的决策风险,并通过一个银行客户信贷问题得到了验证。
其他文献
随着现代工业的发展,越来越多的精密设备和产品生产流水线对电压质量提出了更高的要求.然而电网中总是存在着很多的因素,致使电能质量不能达到用户的要求.因此如何迅速补偿电
随着城市经济和工业的不断发展,对工业用水和生活用水的需求不断增加,而地球上的可用淡水资源是有限的,所以,水资源短缺成为制约社会发展的一大因素。生活污水和工业废水是社会经
流程工业过程中的控制系统通常会受到多个时变扰动的影响。在多个时变扰动下控制系统性能对流程工业过程的安全运行与经济效益至关重要。很多研究者对控制系统性能评估方法和
供应链管理是对供应链上的各节点企业,从原材料供应商、产品生产制造商、产品运输商、产品分销商到最终客户这样一个网络结构进行整体的优化。同时控制和协调这个网链结构上所
学位
碳二加氢反应器作为乙烯生产过程中的关键环节,能够将裂解气中的副产品炔烃转化为乙烯产品,且产物乙烯的品质和产量会受到乙炔加氢选择性以及转化率的极大影响。基于逐点计算的
随着大量新式武器的研制生产,中国人民解放军原有仓储管理模式已不能适应高技术条件下作战的需要,仅靠人背肩扛、手工作业的陈旧方式,显然是行不通的,全面提高维修器材储存与
中国受到传统观念的影响,过去常常习惯于以“心脏搏动停止”作为个体死亡的标准。但近年来随着呼吸循环复苏技术、心脏人工代替技术的迅速发展,特别是心脏移植和心肺联合移植技
利用开放式网络开展商务、政务、网上办公和远程教育等活动对网络的安全性提出了更高的要求,其中关键的安全性要求包括:参与方的身份认证、会话的机密性、会话的完整性和不可
污水处理过程是多变量的、强耦合的、大型的非线性系统,易受进水流量、流入污水中不确定成分及污泥负荷的大的扰动影响。同时,污水处理行业是一种高能耗产业,广泛存在着能量消耗