基于粗糙集的集值信息系统模型及属性约简算法研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:C07467001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞快发展,信息系统中积累了大量数据,急需一种有效处理信息的工具,可以在海量数据中提取、挖掘出隐含在背后的不为人知的、可为人们所用的、有价值的知识。1982年粗糙集理论作为一种处理模糊和不确定数据的新型数学工具被提出,粗糙集理论的重要特点是直接从给定问题的描述出发,不需要任何先验知识,保持分类不变的前提下,导出概念的分类规则。经过30年的研究,已经在理论和实践上都取得了巨大的进步,已成为使用最广泛使用理论之一。粗糙集理论中模型和属性约简是当今研究的两个热点。由于经典粗糙集模型和传统的属性约简算法已经满足不了现实的需求,无论是在模型构建,还是在算法改进方面,很多学者都做了不同程度的研究。但提出更合理的分类模型、处理海量数据的高效属性约简算法仍面临着巨大的挑战。本文分别从模型构建和属性约简两个方面做了深入研究,主要的研究成果包括:(1)在以往提出的模型基础上,针对存在的缺陷,在k度限制相容关系的基础上提出了一种改进的粗糙集模型,基于距离的二元关系模型,即距离关系模型。吸取了k度限制相容关系的阈值k的灵活性和相似关系的对称性的优点,解决了在单一属性下研究的对象的划分问题。并在等价关系三个算子的基础上研究该模型的相关性质,以实例证明该模型分类的宽松度介于相容关系和优势关系之间,分类效果优于相似关系和k度相容关系。(2)针对集值信息系统包含大量数据的问题,本文研究了一种基于β相似度的属性约简方法。在变精度关系下,将β用于约束对象间的相似度,通过β的变化调节类划分的粒度和差别矩阵的复杂度,进而进行属性约简。通过实例证明了算法的有效性、可行性,从时间复杂度空间复杂度上都验证了算法的高效性。(3)在研究了集值信息系统和知识距离性质的基础上,提出了一种基于知识距离的集值信息系统属性约简算法。该算法首先利用知识距离来描述知识间的差距,进而度量集值信息系统模型的分类效果和知识粒度,然后根据知识距离的性质有效的判定集值信息系统模型的宽松度和属性重要性。最后通过理论分析和实验的结果表明,该算法降低了时空复杂度,从而提高了算法的运行效率。
其他文献
词义归纳利用聚类技术自动从未标注语料中获取多义词的词义,从而大大提高语言工作者的工作效率。因此,词义归纳成为当今计算语言研究中一个最重要的课题。本文基于CLP2010提
光刻机系统中,工件台控制系统作为重要的子系统之一,完成工件台的控制和硅片的曝光过程控制。位于测量区的工件台需要与上下片系统、调平调焦系统进行协同工作,完成载片、卸片、
随着当今科技的进步与发展、网络规模在不断壮大,网络的这些特性(如分布性、复杂性、异构化和不合作化)越来越明显,这就加大了网络管理的难度;同时,人们提高了对网络服务质量的要
多功能一体机作为一种集打印、扫描、复印、传真等功能于一身的办公设备。因其节约成本、节省空间、提高工作效率的强大优势,迅速受到企业及家庭用户的青睐。近年来随着一体机
随着企业信息化建设的深入,山西移动同其他大型企业一样,面临来自管理支撑、技术架构和运营管理多维度的转型压力,客观上需要设计新一代企业信息架构以促进业务流程再造和业
随着信息技术的发展,网络的普及,各种各样的信息资源充斥着网络。随着微博的推广,微博的用户在以每年数以亿计的速度增长。每个用户信息包含几十条的属性,应该如何划分微博用
当今,视频监控系统越来越多地应用于日常生活中,它带来便捷的同时,也引出了海量视频流数据的存储需求。分布式存储系统能够很好的满足这一需求,而且由于故障发生的可能性,容
与应用密切相关的传感网,自提出以来就得到了学术界、工业界及军政各界的广泛关注。在早期的传感网密钥管理方案研究中,一般都假设传感器节点是低功耗的、无差异的,网络结构
句法分析是自然语言处理领域中重要的基础研究问题之一,已经被广泛应用于信息抽取、问答系统、机器翻译等领域。因此,众多的学者都对句法分析任务予以高度的重视。本文针对目
人体测量学理论指出人耳外形(耳廓)具有唯一性和稳定性,可用于生物信息特征识别。随着近年来基于激光扫描的三维数据获取技术和数字几何处理基础理论的成熟,三维耳廓的扫描点云数