基于属性重要度的属性约简算法研究

被引量 : 0次 | 上传用户:zhustrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是一种能有效分析和处理不精确、不一致、不完整等各种不完备信息的工具,目前已广泛应用于知识发现领域。粗糙集理论能解决重要的知识分类问题,通过去除冗余对象和属性约简,使决策规则的数量尽可能少,从而达到知识约简的目的。知识约简是指在保持知识分类或决策能力不变的条件下删除其中不必要的知识,它包括属性约简和属性值的约简,属性约简是粗糙集理论的核心内容之一。本论文所探讨的只是属性约简算法中特定的一小类:基于属性重要度的属性约简算法。首先,介绍了Pawlak经典粗糙集理论的背景知识及基本理论和方法。然后,对粗糙集理论发展过程中出现的几个相关理论作了系统地介绍,包括区分矩阵、信息熵和变精度粗糙集模型,并对与之关联的基于属性重要度的属性约简算法进行了深入讨论。接下来是本文研究的重点,分析并提取出基于属性重要度的属性约简算法的共同特征,结合二进制区分矩阵和关键属性的概念提出了新的求核算法,在分析过程中发现现有的基于属性重要度的属性约简算法存在的一些问题以及引发问题的相关因素。最后,提出一种改进的基于属性重要度的属性约简算法。通过深入研究基于属性重要度的属性约简算法的特点发现,该类算法可能导致最终得到的并不是一个真正的约简即约简结果中仍然存在冗余属性,其原因如下:第一,启发式信息的选取不完备。根据粗糙集理论,论域被分为正域、负域和边界域三个部分,而所选取的启发式信息往往只考虑了约简过程中对某个区域的影响。因此,为了设计一个更加完备的算法,必须综合考虑约简过程对各个区域的影响。第二,在约简过程中根据某种启发式信息定义的属性重要度选取属性时,都假设选取到了属性重要度最大或最小的一个唯一属性。如果此时有两个或两个以上的属性满足条件,并没有采取任何选择策略。随意的选择将导致的后果是:得到的约简结果中仍然包含冗余属性。为了避免这种情况,必须采取一种新的选择策略,本论文中采取的选择策略是源于VPRS模型的思想。第三,在约简过程中发现, posB ?D ?(决策D的B正域)中的对象对之后的约简过程已经没有任何意义了,因为其它的条件属性不可能再对这些对象关于决策D的分类起到任何作用。因此,可以考虑在约简过程中逐渐删除这些对象以缩小论域,从而降低算法的空间复杂度和时间复杂度。本文的最终研究成果是为解决上述问题而设计的一个基于属性重要度的属性约简新算法,算法过程中使用的是改进的求核算法和新的属性重要度度量方式,并验证了算法的有效性。
其他文献
针对传统测量方法成本高、操作复杂、图像特征匹配率准确度不高等问题,提出了一种将Kinect传感器与计算机视觉技术相结合的构建人体三维脚型的方法。利用Kinect传感器搭建测
期刊
目的探讨准分子激光角膜屈光手术门诊近视患者的特点。方法收集本院眼科2005年至2013年眼科屈光手术患者的门诊病案资料,分析初次手术病例一般情况及历年变化。结果统计结果
胃神经鞘瘤在临床上缺乏特异性表现及影像学特征、容易误诊,确诊依赖于病理及免疫组化特征,该文报道1例胃神经鞘瘤合并幽门梗阻的诊疗过程并复习相关文献,对该病进行归纳总结
信息产业日渐成为各国的重要产业甚至个别地区的支柱型产业。而对于信息产业相关公司,其开发模式影响着所提供产品或服务的周期,质量以及成本。怎样才能高效的开发出满足客户
本文主要以位于广州市中心城市区域的采用中心岛法基坑支护的广州太古汇项目实施的过程来探讨了中心城区超大型深基坑中心岛法基坑支护的优势;介绍了目前中心岛法基坑支护结
约翰·斯图亚特·密尔(1806年5月20日—1873年5月8日)是十九世纪英国杰出哲学家、自由主义理论家。密尔对政治经济学的贡献巨大、其自由学说更是有着广泛的影响;他是杰里米·
个体工商户定期定额管理是税务机关对不能建账的个体工商户的纳税情况进行管理的一种方式,它是以相关法律法规及政策为导向,主管税务机关根据相关调查,结合同行业该类纳税人
建立了盐酸特拉唑嗪片中盐酸特拉唑嗪的含量测定的HPLC内标法。以盐酸阿夫唑嗪作为内标,采用Alhima—CN柱,流动相为0.05mol·L^-1 NaH2PO4溶液(0.5mol·L^-1的NaOH溶液调p
在20世纪中国的史学史上,唯物史观史学和实验主义史学的针锋相对成为中国现代史学的重要特征。著名唯物史观派史学家翦伯赞在一生的史学活动中,对实验主义史学的批判是至为重要
近年来,美国ASME规范逐渐“认可”和收纳了部分中国压力容器用钢,先后将Q345R、GB/T713-2008《锅炉和压力容器用钢板》中Q370R和15CrMoR等中国压力容器典型用钢分别以规范案