云模型及聚类在规则提取中的应用研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:excalibur
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的研究工作主要围绕两个主题展开:进一步论述和完善了云模型;着重对数据挖掘中的关联规则进行了研究。创新点包括以下几个方面: ●从数据中产生概念是数据挖掘中属性归纳和概念提升的关键问题。用云模型表达定性概念语言值,从数据中产生概念也就是如何从数据中获取语言值对应的云模型的数字特征值的问题。由某一属性的多个属性值生成定性概念语言值,比较理想的做法是:产生多少个语言值云模型一般由用户给定,而这些云模型的数字特征值应通过分析数据得到,无需人工给出每个云模型的数据特征值。而采用聚类方法可以比较客观给出并可验证用户确定的定性概念语言值的合理性,能反映数据库中数据的实际分布;在此算法基础上提出进一步采用正态云的逆向云挖掘算法,由此算法挖掘得到的规则同其它算法相比,由于采用了语言值,因而具有较好的可理解性和有效性。 其它方面包括: ●对云模型的特点进行了阐述,讨论了云模型与统计、模糊之间的区别与联系、概念的可还原性、正态云三个数字特征的含义及相互关系等问题。 全文的内容是这样组织的: 第一章主要介绍数据挖掘的基本概念、研究内容、发展现状及面临的问题与今后的发展方向; 第二章对云模型进行了深入系统的研究,研究了基于云模型的不确定性推理等的理论和方法,给出了各种云发生器算法以及所有的基于云发生器的不确定性推理算法,并且通过实例对云模型、模糊、统计进行了比较,讨论了它们之间的联系与区别,对云的可还原性,即概念的可还原性进行了深入的讨论,并通过实验说明了它们之间存在的内在联系。最后对正态云的三个数字特征及正态云的普适性进行了讨论。 第三章介绍了聚类的目的和重要性,然后给出了衡量一个聚类算法好坏的判别标准,最后介绍了当前数据挖掘中主要的聚类方法,并对它们聚类的基本思想进行了阐述,指出了各自的长处和缺点。 第四章介绍了运用云模型及聚类算法,针对具体的实例,给出了规则提取的过程及实验结果。并分析了实验结果,得出结论。 第五章是对全文的总结以及对今后研究工作的展望。
其他文献
当前,随着计算机的处理能力增大,导致用户对它的期望更多,软件的趋势是朝着更大更复杂的系统发展。这样使得RUP(Rational统一过程)以及UML(统一建模语言)在软件开发中得到越来越
词向量是深度学习背景下的新兴技术,与传统词袋模型不同,词向量将每个词语映射到特殊的语义向量。本文对词向量技术进行系统研究,并通过主题评估的形式实现基于词向量的大规模文
本文主要针对目前手机移动商务方面的应用,采用J2ME技术,同时采用了J2EE的核心技术EJB、Servlet和Jsp等,使用C/S结构,来模拟一个手机移动商铺系统的范例。从J2ME客户端的编制打包
本文就分析型CRM中客户细分的数据分类模型进行研究,主要工作与创新点如下:  首先,详尽研究了客户细分的主要方法,包括基于客户的统计学特征(如公司规模、经营业绩与公司信誉等
置换流水车间调度问题(Permutation Flow Shop Scheduling Problem,PFSP)是车间调度中具有代表性的一个子问题,是经典的具有排列性质的组合优化问题。同时,PFSP在现实中存在多个
本文对基于IPv6的PIM-SM组播协议及OPNET中的仿真实验进行了探究。文章介绍了IPv4/IPv6过渡的主要技术和我国下一代互联网的研究概况;阐述了IPv6组播的新特性;建立了基于IPv6的
本人通过研究和分析了大量的虚拟现实视景仿真系统的开发实例和其中的相关技术后,结合当今主流的3D赛车游戏的应用特点,利用其相似性设计了一套3D赛车游戏实时场景系统的开发模
布尔函数作为一类重要的密码函数,其性能影响着密码体制的安全性。近年来,随着代数攻击及各种新型攻击的出现,代数免疫度等新的指标成为权衡布尔函数性能好坏的重要准则。于是,综
本论文针对现有数据交换中存在的上述不足,以及企业对数据交换提出的跨平台、独立于具体数据库、基于B/S模式的新要求,在分析中间件和XML等技术特点的基础上,实现了一个基于XML的
本文研究了应用级的访问控制,根据基于角色的访问控制模型,针对基于B/S体系结构的信息系统,提出一种实现访问控制的通州解决方案,设计并实现基于角色的访问控制系统平台。该平台把