基于粗糙集的数据挖掘技术研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:ning0001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与网络信息技术的飞速发展,各个领域的数据和信息急剧增加,对这些数据进行分析以发现隐含在数据中的有用模式的要求变的越来越迫切。因此数据挖掘技术应运而生,并得到迅速发展。作为数据挖掘技术的一种有效手段,粗糙集理论凭借其独特的优势在数据挖掘领域中具有越来越重要的地位。将粗糙集应用于数据挖掘领域,能提高对大型数据库中的不完整数据进行分析和学习的能力,具有广泛的应用前景和实用价值。本文系统的阐述了数据挖掘技术的总体研究情况,深入研究了粗糙集的理论框架、概念基础以及粗糙集理论的核心——知识约简,讨论了知识约简与知识依赖性的关系,知识表达系统与决策表的关系,分析了区分矩阵内容的深层次含义以及它与约简的关系。粗糙集应用于数据挖掘知识获取的成功在于其重要的理论支持。在理论基础上的方法产生重要的应用效果。基于这样的思想基础,本文着重研究了粗糙集数据挖掘的相关理论技术及应用方法。主要创新方面如下:给出了一种适于相容和不相容两种形式信息系统差别矩阵的统一构造方法。证明了使用该差别矩阵求核的正确性。使用该方法可避免在属性约简时由信息系统的不相容性所可能带来的问题。另一方面,在属性约简中一个属性的删除或添加的依据是其对系统作用的大小,其判据的基础是近似精度(信息熵可以看作另一形式的近似精度),因此近似精度的确定对于信息系统的属性约简至关重要。为进行属性约简提出了一种期望精度表示。证明了应用期望精度比Pawlak所用(目前被广泛使用)的近似精度能够更好地刻画每个属性对信息系统的影响作用。提出了粗糙vague集(RV sets)的概念。Vague集拓广了模糊集(Fuzzy sets)对事物表达的范围,同时也提供了一种对知识表示的新工具。Vague集鲜明地定义出人们对事物的可知程度和范围的表示方法,从形式上讲在对事物属性的描述上较模糊集提供了更多的选择方式,从内容上讲是对事物属性更细致的描述。因而已在学术界和工程技术界引起了广泛关注。本文研究了粗糙集与vague集的关系,提出了粗糙vague集(RV sets)的概念,并初步研究了其性质。更进一步地,研究了粗糙vague集的相似度量。提出了一种模糊差别矩阵的概念与构造方法,同时给出了应用方法。利用差别矩阵对信息系统进行属性约简是粗糙集理论方法应用的一个重要方面。传统的差别矩阵的概念与构造方法基于完备属性并且属性值为符号型的信息系统。然而,对于模糊或实值属性信息系统的属性约简传统的差别矩阵难于适用。虽有粗糙集扩展模型以及实值(连续)属性分段方法的提出,但由于数据的多样性以及这些方法本身的限制,在应用时存在着各种各样的问题。找出模糊或实值属性信息系统属性约简的好的方法仍然是当前这一领域研究的重要方面。模糊属性信息系统的属性约简与实值属性信息系统的属性约简关联密切,对模糊属性信息系统的属性约简方法可借用到实值属性信息系统的属性约简中去。从这个意义上讲,研究模糊属性信息系统的属性约简具有重要性。在属性约简研究与应用中,差别矩阵是一个重要的概念,也是粗糙集理论方法的一个重要部分。由于对于模糊属性信息系统现有的差别矩阵方法难于使用,本文提出了一种模糊差别矩阵的概念与构造方法,同时给出了相关的定理和应用举例。
其他文献
Ad hoc网络(MANET)是一种动态多跳无线网络,由一组共享无线信道的移动节点组成。近年来,由于其快速方便的自组织特性和不需要预设网络基础设施等特点,无线Ad hoc网络已经得到
入侵检测技术是近年来网络安全研究的一个重点,但它面临着许多挑战,其中最主要的就是检测速度不能适应网络流量的飞速发展。大多数网络入侵检测系统在不牺牲检测质量的前提下
随着定位技术与无线通信技术的迅速发展,对移动对象进行跟踪与定位变得可行与必要。移动对象信息管理在交通监测、舰船导航、移动计算、气象预测、电子战场等诸多领域有着广
网关是一种网络互联设备。嵌入式CAN—以太网网关是指完成CAN总线到以太网的异型网络互联的嵌入式设备。 论文首先结合本项目的应用背景煤矿来具体分析研究嵌入式CAN—以
OSPF(Open Shortest Path First)是IETF(Internet Engineering Task Force)于1988年提出的一种基于链路状态算法的动态路由协议,它是用于IPv4网络自治系统内部的内部网关协议
有关流数据分析与管理的研究是目前国际数据库研究领域的一个热点。在过去30多年中,尽管传统数据库技术发展迅速且得到了广泛应用,但是它不能够处理在诸如网络路由、传感器网
嵌入式技术已进入一个崭新的时代,Freescale公司推出的新一代8位M68HC08系列微处理器,因其速度快、功能强、功耗小、价格低等优点,在业界得到了广泛的应用。为了能方便快捷地
视觉显著性计算模型以心理学、神经科学、认知理论等领域的研究成果或假说为前提,建立数学模型来模拟人类视觉系统指引注意力分配和视觉认知的过程,通过模拟和仿真人类视觉感
互连网络为多计算机系统中处理器单元之间的通信提供了一种有效的机制,随着并行计算机互连网络规模越来越大,网络中出现处理机故障或处理机间的边故障的可能性也越来越大。因
多功能扫描仪作为未来扫描仪市场发展的方向,很好的适应了市场对扫描仪高速率、多样化、专业化的要求。然而随着扫描仪性能提高的同时,对计算机和扫描仪间的数据传输率也提出