基于粗糙集的缺失数据填补技术研究

来源 :第七届中国Rough集与软计算、第一届中国Web智能、第一届中国粒计算联合会议(CRSSC-CWI-CGrC'2 | 被引量 : 0次 | 上传用户:yww74
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术的进步使得人们积累的数据量爆炸式增长,但知识却难以获取。大量数据堆积起来形成“数据坟墓”,如何将其转换成知识“金块”,数据挖掘技术应运而生,它从海量数据中提取或“挖掘”知识,供决策之用。然而,存在不完整的,含噪声的和不一致的数据是大型的、现实世界数据库或数据仓库的共同特点。普遍存在的规律是:数据质量越好,挖掘的结果也越准确。因此,数据预处理是数据挖掘过程的重要阶段。对于缺失数据的处理,已有许多方法,比如Mean Completer算法、Combinatorial Completer算法等。这里提出一种基于粗糙集的方法,在第一步利用相容关系降低不完备程度后,第二步将数据表分解、逐层分类,再在细化的类中使用最可能的值填补缺失数据,完备我们的决策系统。本文介绍了基于粗糙集的两步填补算法。总结两步填补算法利用了粗糙集在处理不完整性和不确定性问题方面的优势,在试图降低输人集的不完备程度之后对其分解,逐层分类,获得比用决策属性划分更细的集合,使得其中的对象高度相似,并以此填补缺失数据,以尽可能最大程度保持知识的一致性。
其他文献
今年纺织行业“秋季三展”即将于8月29~31日如期在上海新国际博览中心启幕,第17届中国国际家用纺织品及辅料(秋冬)博览会、2011中国国际针织博览会和2011中国国际纺织纱线(秋
模糊集合理论的核心是建立研究对象的隶属度函数,通过隶属度函数来研究论域中元素之间的接近程度。分类是按某种标准来鉴定论域中元素之间的接近程度,把彼此接近的对象归为一类
会议
陈俏汐2004年考入中央美院附中2008年专业保送中央美术学院现就读于中央美术学院版画系2011年作品入选中央美术学院版画优秀作品展作品《ocarina》系列入选2011年第四届五四
Rough集理论是由20世纪80年代波兰人ZPawlak提出的一种新的数学工具,它通过严格的数学公式来处理不精确性、不确定的问题,具有演绎、归纳和常识推理等能力,因此,Rough集理论很快
会议
数据挖掘是指从大量数据中提取出有效的、新颖的、潜在有用的,以及最终可理解的模式的高级过程。其目的是从数据中抽取知识。而分类知识是反映同类事物共同性质的特征型知识和
会议
女儿赌气上北大“儿子,你一定要考上北大。”已经69岁的温海东永远无法忘记高二那年父亲临终前的遗愿。尽管随后付出了艰辛的努力,他最终还是因为政审原因,被挡在北大校门外
采用三因子五水平二次回归通用旋转组合设计试验,应用回归分析方法建立了本区域冬小麦丰产栽培技术模型,探索主效栽培因子和综合农艺措施,寻求最优方案,获得高产优化农艺方案.
粒计算是人们对人类全局分析能力的一种模拟,人类全局分析能力是人类智能的最主要的特点之一,人类具有很强的全局分析能力,他们能从各种不同的粒度(层次)将错综复杂的问题抽象归
会议
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
本文在R-M等随机逼近算法基础上,讨论了动态系统中随机序列为鞅差序列的一种随机逼近的鞅方法。