时间序列特征提取与聚类算法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:a316529455
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列,在经济、金融、科学观测和工程等各个领域都广泛存在。时间序列数据反映了属性值在时间或空间顺序上的特征,利用时间序列数据挖掘(Time Series Data Mining,TSDM),可以获得数据中蕴含的与时间相关的有用信息,实现知识的提取。目前时间序列数据挖掘中重点的研究内容包括时间序列的模式表示、时间序列的相似性查询、时间序列的聚类和分类、时间序列的异常检测等。 本文以时间序列的特征提取和聚类为研究主题,讨论了时间序列的距离(相似性)度量问题,研究了时间序列特征提取方法、时间序列的聚类算法、聚类准则等问题。本文的主要研究工作和成果概括如下: (1)分析讨论了适用于时间序列的距离度量,以及目前常用的时间序列聚类算法,对各种算法的特征做了分析比较。将聚类准则函数引入对聚类效果的评价当中,使得对聚类的研究工作更加清晰易懂。 (2)提出了分段混合特征提取算法。本文在分析和比较了原有的各种时间序列特征提取方法之后,以分段特征提取方法为基础,提出了分段混合特征提取的时间序列特征提取方法,将时间序列总体特征和变化模式引入特征提取当中,克服了现有的分段特征提取方法和其他方法都无法同时客观地描述时间序列的整体趋势和局部特征的问题。 (3)对synthetic control chart time series时间序列数据集进行了特征提取和聚类研究。本文通过实验分析现有k-均值算法和层次聚类算法的聚类效果,讨论以上两种算法直接处理原始时间序列的局限性和问题,分析了只借助距离度量的改进,例如引进DTW距离也无法提高时间序列识别的效率。最后,将本文提出的分段混合特征提取算法引入层次聚类,实验结果显示本文所提出的分段混合特征提取算法能改进时间序列层次聚类的效果,提高了时间序列识别的效率,从而验证了本文所提出的分段混合特征提取算法的有效性。 最后在总结全文的基础上,说明了今后需要继续的工作。
其他文献
在动力系统的研究中,通常很难判定任意给定的一个系统具备怎样的性质,这时我们往往把某一类系统的全体作为一个大的空间,来研究具有某种性质的动力系统有多少。这里,“多少”往往
图的Randic指数定义为R(G)=∑u~v(d(u)d(v))-1/2,这里d(u)是项点u的度,∑对所有相邻的顶点对(u,v)求和。1988年,S.Fajtlowitcz提出如下猜想:对所有的连通图G,R(C)≥r(G)-1,这里r(G)是
在初中数学教学中,结合教材实际,以习题为载体,让学生进行解题后反思,从解题到思维能力的转化,到思维能力的提升,起至关重要作用的是——解题后反思,本文以相关习题为例,论述
最近,笔者看到一本英文版的书——《经济数学》,不经意地翻了翻,看到书中的命题不多,例题也不过20多道,但对每一道例题进行了不断地拓展和延伸,不仅对例题中所涉及的每一个定
教务管理工作是独立学院的重要工作内容,教务管理队伍素质的高低在某种程度上决定了独立学院的教育管理水平.文章根据现阶段独立学院教务管理工作现状和存在的问题,为如何更
齐次可微函数在应用数学的许多方面都有着广泛的运用,其中这些函数的可微性在运用中起着至关重要的作用.但是,有很多齐次函数本身是不可微的.为了放松这些函数可微性条件,人们引入
在当今网络化、信息化的时代,信息己成为社会发展的重要资源,成为推动社会进步、经济发展和科技变革的动力之一.高职院校教学管理的信息化己是不可逆转的趋势,高职院校教学管
本文针对2-赋范空间的凸性和光滑性,在总结了Banach空间的凸性理论的基础上,对2-赋范空间的凸性作了系统的整理,将2-赋范空间推广到拟2-赋范空间,并研究了拟2-赋范空间的凸性,最后
随着人们对软件质量的日益关注,软件测试作为保证软件质量,提高软件可靠性的重要手段也逐渐成为软件开发过程中关键的一部分。但是传统的测试技术对于软件中存在的一些问题不能
本文研究了分布参数系统的能控性及不敏感控制问题.全文共分五章. 第一章是综述,首先总体上介绍了热系统的能控性和控制代价的研究现状,再者介绍了半线性热系统和波动系统的不