论文部分内容阅读
符号化时间序列与聚类分析应用是近年来研究的热点问题,时间序列符号化在信息分析中广泛应用,聚类分析是数据挖掘领域的热点问题,而将时间序列进行符号化,对符号串进行聚类在水文中应用的研究并不是很多。国内外关于降水的研究集中在纯粹的气候、气象上,降水研究所运用的方法相对简单;很少有学者、专家将其运用到降水的研究当中,导致研究者很难挖掘出降水数据间存在的深层次相似关系。本文针对以上问题,提出了两种符号化方法及两种聚类方法进行研究。 论文以我国省会城市1951-2008年间的年降水量为研究对象,将不同城市的年降水看成时间序列,然后离散化处理这些时间序列,通过扩展符号聚集近似方法和等级划分方法对时间序列进行符号化处理,依据符号间的相似性用距离属性及模糊聚类进行聚类研究,挖掘出城市间在降水量方面的相似性,为干旱、洪水等极端天气的预报和预警等提供一定的科学依据和参考价值。 论文用两种符号化时间序列聚集方法对我国不同站点进行聚类分析,丰富了符号化时间序列聚类的内容,并为水文过程的聚类找到新的切入点。将符号化方法与模糊聚类方法相结合,并应用于水文序列的研究中,丰富了水文时间序列聚类的方法和内容,字符串聚类也为时间序列数据挖掘提供新的方法和手段。