一种基于粗糙—模糊集理论的知识获取方法

来源 :电脑知识与技术·学术交流 | 被引量 : 0次 | 上传用户:wangdianxitong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:该文提出了一种基于粗糙-模糊集理论的知识获取方法,该方法将粗糙集理论与模糊集理论相结合,先利用模糊集理论对决策表的连续属性进行模糊化,通过构建模糊相似矩阵进而划分论域;再利用粗糙模糊集理论进行属性约简,从而获取决策规则。最后,通过实例验证了该方法的有效性和实用性。
  关键词:粗糙集;模糊集;属性约简;知识获取
  中图分类号:TP393文献标识码:A文章编号:1009-3044(2008)23-1029-03
  Knowledge Acquisition Approach Based on Rough-Fuzzy Sets
  CAI Hong, YE Shui-sheng, ZHANG Yong
  (Nanchang Hang Kong University, School of Computing, Nanchang 330063, China)
  Abstract: This article presents an approach of knowledge acquisition based on rough and fuzzy sets, which combines features of rough sets and fuzzy sets. The continuous attributes in the decision table are fuzzified with fuzzy membership functions. The domain partition is accomplished after establishing fuzzy similarity matrix. Attributes reduction can be obtained using rough-fuzzy sets, and then decision rules can be acquired. At last, an example is illustrated and proves the approach is effective and practical.
  Key words: rough sets; fuzzy sets; attributes reduction; knowledge acquisition
  粗糙集理论是一种处理不完整和不确定信息的有效数学工具,它具有知识获取完全由数据驱动,不需额外信息的优点。但是,粗糙集理论直接处理连续属性的能力非常有限,因而连续属性的离散化成为制约粗糙集理论发展的难点。而模糊集可以通过模糊隶属度函数来刻画集合中子类边界的模糊性,两者正好互补。因此,本文将粗糙集与模糊集理论相结合,提出了一种基于粗糙-模糊集理论的知识获取方法,并通过实例验证了该方法的有效性。
  
  1 基于模糊相似关系的论域划分模型
  
  1.1 连续属性离散化
  对于决策表中任一连续属性,根据值域的大小和属性值的分布,可以将其模糊化为k个语义变量,而这k个模糊划分的中心mi可由Kohonen网络自组织映射算法确定。
  1.2 基于模糊相似关系的论域划分方法
  1)利用数量积法建立模糊相似矩阵R=(rij)n*n,rij表示对象xi和xj的相似程度。rij定义如下:
  2)在此基础上,引入置信水平λ,rij经过如下操作,得到普通相似矩阵Rλ。
  3)基于模糊相似关系的论域划分方法
  输入:决策表四元组,普通相似矩阵Rλ,其中A=C∪D,C为条件属性集合,D为决策属性集合。
  输出:论域划分U/ND(Rλα) ={V1,V2,V3,…,Vt}。
  Step 1:i←1, j←1, t←1, V1←{ u1 }
  Step 2:if ( i与|U|相等) 划分完成退出
  else 转向Step 3
  Step 3:i←i+1, j←1
  Step 4:if ( μa(ui) 与μa(vj)相等) Vj←Vj∪{ui},转向Step 2
  else 转向Step 5
  Step 5:j←j+1
  Step 6:if (j大于t) t←t+1,Vt←{ui},转向Step 2
  else 转向Step 4
  
  2 基于属性依赖度的约简算法
  
  2.1 模糊粗糙集的上、下近似和属性依赖度定义
  根据基于模糊相似关系的论域划分方法,可以得到属性a∈A且在置信水平λ下对论域U的划分U/ND(Rλα) ,其中不同的属性可以采用不同的置信水平对论域进行划分,那么属性集A对论域U的划分可以表示为:
  如果用Fi表示式(3)中的U/ND(Rλiαi),那么式(3)可表示为:
  2.2 基于属性依赖度的约简算法
  基于属性依赖度的约简算法主要思想:首先令R为空集,依次把那些使γR(D)的增量达到最大的属性添加到集合R中,直到γR(D)达到最大,输出决策表的一个最小属性约简集合R。算法描述如下:
  输入:决策表四元组< U, A, V, f >,属性依赖度RM(D),其中A=C∪D,M?哿C。
  输出:决策表的一个最小属性约简集合R。
  Step 1:R←{ }, T←{ }, γbest(D)←0, γprev(D)←0
  Step 2:T←R, γprev←γbest(D)
  Step 3: , T←R∪{y}
  Step 4:R←T, γbest(D)←γR∪(y)(D)
  Step 5:if (γbest(D)与γprev(D)相等) 约简完成退出
  else 转向Step 2
  
  3 决策规则归纳算法
  
  根据上面提出的粗糙-模糊集模型,进行决策规则归纳以获取知识,具体步骤如下:
  1) 利用Kohonen网络自组织映射算法确定k个模糊划分的中心mi,并采用三角隶属度函数对连续属性进行模糊化;
  2) 根据基于模糊相似关系的论域划分方法得到对整个论域的划分;
  3) 根据基于属性依赖度的约简算法得到条件属性集的一个最小约简集;
  4) 删除决策表中重复实例,归纳出决策规则。
  
  4 实验
  
  为了验证算法的有效性,将上述提出的基于粗糙-模糊集理论的知识获取方法应用于如表1所示的决策表中,其中C={a1, a2, a3, a4},D={d}。
  首先,对条件属性集C四个连续属性进行模糊化。利用Kohonen网络自组织映射算法确定5个模糊划分的中心mi,并采用三角隶属度函数对连续属性进行模糊化,其隶属度函数如图1和图2所示。
  其次,根据基于模糊相似关系的论域划分方法得到对整个论域的划分。令λ=0.8。
  再次,根据基于属性依赖度的约简算法得到条件属性集的一个最小约简集。
  γc(D)=5/6,而γ{a2,a3,a4}(D)=1/3,γ{a1,a3,a4}(D)=2/3,γ{a1,a2,a4}(D)=1/2,γ{a1,a2,a3}(D)=5/6,可以得到约简集{a1, a2, a3}。
  最后,删除决策表中重复实例,归纳出决策规则。
  1)IF 1.4 ≤ a1 ≤ 1.9 and 1.6 ≤ a2 ≤ 1.8 THEN d=1;
  2)IF 1.4 ≤ a1 ≤ 1.9 and 2.1 ≤ a2 ≤ 2.6 and 1.01 ≤ a3 ≤ 1.10 THEN d=1;
  3)IF 1.4 ≤ a1 ≤ 1.9 and 2.1 ≤ a2 ≤ 2.6 and a3 = 0.78 THEN d=2;
  4)IF 2.2 ≤ a1 ≤ 2.7 and 2.1 ≤ a2 ≤ 2.6 THEN d=2;
  5)IF 3.1 ≤ a1 ≤ 3.8 and 2.1 ≤ a2 ≤ 2.6 THEN d=3;
  6)IF 2.2 ≤ a1 ≤ 2.7 and 3.5 ≤ a2 ≤ 3.9 THEN d=3;
  7)IF 3.1 ≤ a1 ≤ 3.8 and 3.5 ≤ a2 ≤ 4.9 THEN d=4;
  8)IF a1 = 4.9 and 3.5 ≤ a2 ≤ 3.9 and 0.42 ≤ a3 ≤ 0.56 THEN d=4。
  
  5 结论
  
  本文提出的基于粗糙-模糊集理论的知识获取方法,是将粗糙集理论与模糊集理论相结合,先利用模糊集理论对决策表的连续属性进行模糊化处理,以避免直接离散化带来的信息丢失,再利用粗糙模糊集理论进行属性约简,进而获取决策规则,该方法为解决连续属性的规则获取问题提供了一条有效途径。
  
  参考文献:
  [1] 张化光,徐悦,孙秋野.基于模糊粗糙集的系统连续变量离散化方法[J].东北大学学报(自然科学版),2008,(1):1-4.
  [2] 吴山产,毛锋,王文渊,等.基于粗糙集的两种离散化算法的研究[J].计算机工程与应用,2004,40(26):68-69.
  [3] 樊雷,雷英杰.基于直觉模糊粗糙集的一种知识获取方法[J].计算机工程与应用,2008,44(4):39-41.
  [4] WU Wei-zhi,ZHANG Wen-xiu,LI Huai-zu. Knowledge acquisition in incomplete fuzzy information systems via the rough set approach[J]. Expert Systems,2003,20(5):280-286.
其他文献
0前言rn社会支持是指一个人从社会网络所获得的情感、物质和生活上的帮助,其中领悟社会支持是指个体对社会支持的期望和评价,是对可能获得的社会支持的信念.以往关于社会支持
摘要:基于虚拟仪器技术,设计和实现了某型雷达的性能测试系统。该系统采用PXI总线与GPIB总线相结合的方案,按照以PXI卡式仪器为主,GPIB程控分立仪器为辅的原则设计了系统的组成结构。系统的软件采用Measurement Studio For Visual Basi开发完成,在软件设计中采用数据库技术记录PXI资源分配情况及设备测试流程,有效地提高了自动测试软件的可维护性和可扩展性。  关键词:
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
目前地方高校人才流失严重,从前人所说的“大学者,大师也”这句经典论述中我们可以看出人才对大学的重要性.人才流失已经造成地方高校学术队伍不完整,师资队伍不健全,已经成
汇率是联系国际经济的重要纽带,是影响一国价格体系中资源配置及其效率的重要变量。学术界近年来十分关注汇率的传导机制、传导效应以及波动行为。在开放经济背景下,一国经济面
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
采用DNA超级计算,设计出芯片错误测试的有效算法,并将之与现有测试技术结合,解决现有集成电路中错误测试中存在因耗时过长而无法保证芯片电路准确率达到100%这一实质问题。最后阐述了芯片测试的DNA计算机算法研究的意义、现状、研究内容、研究方法等。
旅游产业是朝阳产业,特别是对于阜新市这种资源枯竭型转型城市,旅游产业的发展即可带动地区经济全方位发展,同时也利于资源型城市的生态环境恢复和可持续发展.阜新地区近些年