基于澜沧江空间数据仓库的例外挖掘研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:Nick0409
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据联机分析挖掘(0LAM)是将OLAP和数据挖掘有机结合,OLAP的分析结果为数据挖掘提供分析信息,作为挖掘的依据;数据挖掘拓展OLAP分析的深度,发现0LAP所不能发现的更为复杂细致的信息;它能方便地对任何一部分数据或不同抽象级别的数据进行挖掘,得到更为详细、更为有用的信息,成为了数据仓库研究的热点.例外挖掘是数据挖掘中的一个重要研究方向,例外数据的挖掘往往可以使人们发现一些真实、但又出乎意料的知识.但传统的例外挖掘算法存在许多不足,比如缺乏用户的导向和控制,在挖掘之前就确定了挖掘空间,不能动态地根据中间挖掘结果选取挖掘空间等缺点,有必要引入基于数据仓库的例外挖掘研究.该文的研究目标是实现从某个特定主题的各个CUBE中发现更具有实用价值的多维度的、多层次的例外知识.该文工作如下:首先,构造了澜沧江空间数据仓库的原型系统,建立了一种体系化的数据存储环境,将决策所许需的大量数据从传统的操作环境中分离出来,使离散的、不一致的数据转成集成、统一的信息,使分析人员能快速、交互并方便有效地浏览数据,从而指导澜沧江流域的开发.该文第三章重点介绍了该系统的多维分析功能.然后,针对现有局部例外度计算复杂的困难,提出了一种新的局部例外度的定义.该定义是基于对象o的k距离和k距离邻域,是对象o的k距离与对象o的k距离邻域对象的距离比值的平均值.并证明了该定义能够挖掘出基于距离异常算法所不能识别的一类例外数据——局部例外.在此基础上我们讨论了OLAM挖掘模型,分析了OLAM挖掘方法的困难;针对0LAM挖掘的挖掘模式,提出了基于约束的例外挖掘算法和基于OLAP的探测试挖掘算法.其中,基于约束的例外挖掘算法是在挖掘之前,通过三种约束条件来限制挖掘空间,从而提高挖掘的效率.而基于OLAP的探测试挖掘算法采取边挖掘、边进行OLAP操作,提高了与分析人员的交互程度.最后,在澜沧江空间数据仓库的系统上实验验证了算法的正确性和有效性.
其他文献
如何强化基本素质,树好自身形象,在地方党委班子赢得地位和威信,确实值得探讨和研究。我结合自己的工作实践和平时的深入思考,谈几点粗浅的体会。 靠学习来提高素质。首先要
该文是基于洛带气田高低压分输方案优选研究的一个智能决策支持系统.洛带气田高低压分输方案优选研究智能决策支持系统(IDSS系统)是针对洛带气田蓬莱镇组气藏高低压分输开采
灰色系统理论发展至今,已被成功应用到各个领域,特别是灰色预测理论在工业、农业、经济、科技等领域取得比较好的成绩。然而,当现实观测的数据与真实数据有着较大偏差时,现有的模
兴和县地处河北、山西、内蒙古三省区交界处,气候干燥,土地贫瘠,生产条件恶劣,严重制约广大农民脱贫。三年来,通过我们实实在在的工作,不但在扶贫帮困上取得了较好成绩,而且
定量遥感的本质在于反演,而反演问题通常却是病态的.一方面,地球表面的多变性导致反演模型复杂,求解困难,另一方面,目前遥感获取技术的限制,遥感反演中的信息量远远不足.因此
这篇博士论文系统地分析了用于求解带有弱奇性核Fredholm第二型积分方程的小波Petrov-Galerkin算法,包括其收敛性,稳定性和计算复杂性.与此同时,一类数值积分方法被用于矩阵
位于大兴安岭和呼伦贝尔草原交汇处的内蒙古牙克石市,是一个依托林业发展起来的小城。近年来,随着国家天然林保护工程的实施,林业生产以及相关产业出现了前所未有的困难,经
本文以中国网通2002年2月开始的90周卡类语音收入数据、主叫后付收入数据、主叫预付收入数据、专网接入收入数据、宽带电话收入数据、总收入数据为基础,按照周为单位运用ARIMA
党的十六大报告郑重提出要在全党开展以实践“三个代表”为主要内容的保持共产党员先进性教育活动。这是党中央在党的建设上又一具有全局意义的重大举措,是贯彻落实科学发展
模糊有限自动机理论在计算理论中是一种重要的数学模型,在计算机学科的应用领域方面有着十分重要的作用。乘积是模糊有限自动机理论中的一种基本运算,通过构造不同的乘积自动机