基于兴趣度的增量数据挖掘算法的研究

来源 :河海大学 | 被引量 : 0次 | 上传用户:vitor330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)是一种从数据库中提取数据、用先进的分析方法开发智能化的、基于事实的一种业务决策和战略的技术,即一种在大量数据中发现信息的有效方法,而时态数据库(Temporal Database)中的时态数据是数据信息中的重要一类,本文就基于时态数据的增量数据挖掘进行了研究,并引入了兴趣度的概念作为评测标准,本文着重分析研究以下几方面的内容: (1)阐述了数据挖掘的现状、挖掘的具体过程以及挖掘方法分类;给出数据挖掘的具体流程图,说明了关联规则的具体模型,介绍了APRIORI算法是如何挖掘出交易集中的布尔型关联规则。 (2)引入兴趣度,论述了关联规则有趣性问题,主要从主观和客观两个方面进行评测,利用模板将用户感兴趣和不感兴趣的规则区分开,以此来完成关联规则有趣性的主观评测,在关联规则的置信度和支持数基础上提出关联规则的兴趣度概念,并以此对关联规则的有趣性的客观评测增加了约束。 (3)给出了时态数据库中的相邻关系(Adjacency)和增量(Increment)的意义,提出了基于定量属性离散化的基本增量模型,介绍了常用的定量属性离散化方法,并结合DHA法建立一完整的数据挖掘模型,最后用兴趣度等标准判定得出用户感兴趣的定量关联规则。 以上相关的模型,算法及分析通过一个原型系统的实验,证明是有效可行的,所得的运行模型及规则可为系统的决策提供有效的信息。
其他文献
在光照不均匀,存在阴影以及存在背景小杂色块干扰的图像中准确辨识出叶片图像,并将其显著特征抽取出来是本次课题的研究重点。本课题在对实际叶片图像信息抽取这个领域,提出
该文的主要内容是讨论细胞自动机的自演化方法及其内部运行机制,特别是遗传算法在细胞自动机自演化中的应用.首先我们介绍了细胞自动机的起源,发展,现状,还介绍了其主要特点
目前国内有一些相关领域的预测软件,如彩票预测软件等.这些软件只是实现该领域内的指标预测功能,预测的智能性较低,而且不具有通用性,不能进行跨越领域的指标预测.另外随着In
该文基于并行CORBA的原理,提出了油气储层随机建模的网络并行计算模型;改造了原有的串行计算代码;封装成并行CORBA对象,使之符合SPMD并行执行模型,解决了串行代码并行化的问
MPLS是一种新的网络技术,它将IP路由技术和ATM交换技术紧密结合,既实现了路由的智能,又利用了ATM交换机的高效硬件交换.该文首先介绍了MPLS的背景知识、技术原理、技术优势以
随着Internet上中文信息的增加,智能化搜索引擎已成为中文检索技术未来的发展目标与趋势.概念检索作为一种实现技术有着广泛的应用前景.该文回顾了搜索引擎的历史、国内外现
计算机领域技术更新速度非常快,但计算机的基本体系结构相对来说几乎不变。可重构计算技术(Reconfigurable Computing—RC)为传统通用处理器和专用处理器(ASIC)提供了一个非常
目前Boosting方法己在数据挖掘的多个领域特别是在文本挖掘中得到了成功的应用.该文致力于解决在Boosting的理论和实际应用方面出现的一些问题,以提高其分类精度和学习速度,
该文包括六章.以下分章节对具体内容进行介绍.第一章介绍电力线载波通信的现状及其发展趋势,通过对当前状况的分析,指出电力线载波通信的发展方向在低压电力线通信领域.第二
基于UML的嵌入式实时软件开发技术和开发环境是当今嵌入式实时领域研究的一个热点.基于UML的嵌入式软件开发需要把现有的面向对象开发技术和UML的使用经验,如可视化建模、模