【摘 要】
:
随着数据库应用的不断深化,越来越多的数据被贮存到了计算机中,但是数据库管理系统却没有提供有效的工具和方法来利用这些数据,因此充分利用数据进行决策支持成为当今最需要深入
【出 处】
:
中国地质大学 中国地质大学(武汉)
论文部分内容阅读
随着数据库应用的不断深化,越来越多的数据被贮存到了计算机中,但是数据库管理系统却没有提供有效的工具和方法来利用这些数据,因此充分利用数据进行决策支持成为当今最需要深入研究的领域。作为一种新的数据分析工具,数据挖掘的发展十分迅速。与传统的统计、总结方法相比,数据挖掘技术涉及到多个学科,汇集了人工智能、模式识别、数据库、机器学习以及管理信息系统等学科的成果。各种类型数据都可以作为数据挖掘的对象。时间序列在数据集中十分普遍,在社会生活中的各个领域广泛存在着大量的时间序列数据有待进一步的分析和处理。对时间序列进行数据挖掘已成为当前研究的焦点之一。当前对时间序列数据挖掘的研究大部分集中在相似性研究方面,针对模式发现和规则发现的研究内容比较少。
本文首先介绍了数据挖掘及相关概念,对目前的时序分析方法进行了分析,进一步论证了用数据挖掘方法研究时间序列问题的价值及可行性。由于时序数据模式可以看成是关联规则考虑时间因素后衍生出来的,故时间序列挖掘可以借鉴序列模式挖掘的方法,在考虑了数据之间的序列关系的前提下,对时序数据进行挖掘。重点对目前挖掘关联规则及聚类算法进行了分析,介绍了关联规则与聚类的相关知识,结合模糊理论,对模糊关联规则及聚类的知识进行总结。针对关联规则挖掘算法中规则的有效性,提出了有效率的概念,经实验证明可以较好地改进挖掘出的关联规则,从而证明了有效率的用处。针对模糊聚类算法中隶属度的归一性造成的孤立变量对聚类中心的隶属度的偏离的情况,在本论文中对隶属度进行了改进,并对模糊时间序列数据挖掘的算法进行了优化,实验说明能比原算法有更好的性能。 最后结合模糊关联规则和模糊聚类分析方法,将状态演化模式扩展到模糊演化序列中,为以后的研究做好了准备。
其他文献
聚类是数据挖掘中重要的组成部分,是一种无监督的学习。聚类算法是将一组分布未知的数据进行分类,尽可能地使得同一类中的数据具有相同的性质,而不同类的数据其性质各异。近
长期以来,确定避雷针防雷安全范围是电气设备安置和建筑物设计、特别是易燃物库的设计中不可忽视的重要工作,防雷保护的计算难度虽然不大,但多支避雷针的联合保护,特别是不等
随着分布式数据库系统的广泛应用,如何以最小的开销保证数据库系统中数据各冗余副本之间的一致性,成为该领域的一个研究热点。尤其在异构或异质的环境中,这一问题显得更加复
分层次教学是现代中等职业教育教学改革的热点,其中心思想是将对某门课不同学习能力的学生分成几个层次(组),每个层次代表不同的学习能力,每个层次中的学生学习能力相似。针对每
随着信息系统的复杂化和网络互联技术的广泛应用,信息系统的安全问题日益突出,各种网络和信息系统的安全越来越依赖于防火墙、入侵检测系统等安全应用软件和产品的保护。这些安
在目前的 WEB 系统中,用户界面是指计算机与其使用者之间的对话接口,是 WEB 系统的重要组成部分,它直接关系到整个计算机系统的可用性和使用效率。目前开发用户界面的工作量
因特网是一个巨大的全球性的信息服务中心。传统的媒体受到冲击,逐渐向网络媒体转变,提供网络信息服务的竞争日益激烈。目前的网络新闻服务站点基本上是基于B/S结构的单一的
在控制理论和技术飞速发展的今天,PID控制由于其具有控制方法简单、易于实现和现场调试等优点,被广泛应用于工业过程控制。在实际过程中,被控过程都是非线性的且具有时变不确
本文在基于RTLinux开放式数控系统研发的课题背景下,对数控系统中控制器软件的一个重要模块——数控代码解释器进行了研究与分析。文章根据具体任务课题,研究了基于RS274/N
形式概念分析(Formal Concept Analysis)这一新兴的数据挖掘理论,是由德国学者Wille提出的。形式概念分析的思想主要来源于哲学,在哲学中,概念是由外延和内涵两部分组成的思