论文部分内容阅读
自1966年邢台地震以来,我国开展了广泛的地震预测研究。地球物理观测数据是开展地震分析预测的基础。河北省地球物理观测台网采用数字化观测技术、网络化传输和数据库存储,为地震预测和地球科学研究提供了各种观测数据服务。一般认为,在地震孕震过程中,大地形变、岩石圈地磁场、地下流体的物理性质和化学性质会发生较为明显的变化。这些变化反映在观测数据上就是:在一段时间内,仪器监测到的数据记录数值会有不同往常的异常反应,如发生数值突跳等情况。地震前兆观测数据常以时间序列的形式呈现,本文将孕震过程中出现的观测数据不稳定的时间序列称为地震前兆异常时间序列。在河北省地球物理观测数据库中,与地震前兆异常时间序列在形状上相似的时间序列是否存在,在历史数据中出现的次数,出现后的近期是否监测到地震情况,这些信息可以为地震预测提供重要的数据支持。因此,需要研究地震前兆异常时间序列的相似序列查找识别方法。本文基于河北省地球物理观测数据库中的观测数据,分析了地震前兆观测数据的主要特征,重点研究数据预处理技术;结合时间序列挖掘中的相似性查找方法,进行等长度时间序列的查找;提出基于分段累合的动态时间弯曲距离算法,实现了具有不等长度但形状相似的时间序列的查找;之后研究基于深度学习的目标检测算法,降低时间序列相似性查找的复杂程度,有效避免采样率不一致、时间序列分割以及数据预处理等情况所带来的问题。本论文主要研究工作如下:(1)插值方法实验。在数据预处理阶段,主要针对河北省地球物理观测数据库中的缺数、断数情况,研究适用的数据插值方法。设计插值实验,使用三次样条插值方法、线性插值方法和分段三次Hermite插值方法在不同程度数值缺失情况下进行插值运算,将插值结果和实际数据的标准误差进行对比分析,验证了三次样条插值方法对本文实验数据的实用性。(2)基于相似性查找方法研究。采用相关系数corrcoef算法和时间序列相似性度量方法,如欧式算法、动态时间弯曲算法等,计算序列间的相关系数和距离值,并对结果进行排序,查找出与地震前兆异常时间序列具有相同长度(即数据点个数相同)的相似序列。通过对实验运行时间和运行结果的综合分析,验证了corrcoef函数对本文场景下的查找具有较好的效果。(3)基于分段累合的动态时间弯曲算法。对原始数据序列的数据表示方法进行分析,利用分段累合降维技术,减约时间序列数据维数,生成新的特征序列。使用了引入衰减系数的改进动态时间弯曲算法,查找与地震前兆异常时间序列不等长的相似时间序列。通过实验证明该方法可以提高不等长相似时间序列查找准确性。(4)基于深度学习的目标检测算法。提出了SSD_MobileNet目标检测算法。对样本图像进行形状特征提取,其中样本图像来自地震前兆异常时间序列组成的数据集。利用样本数据集,对SSD_MobileNet算法模型进行模型训练,在此过程中提取、保存本文实验数据序列所适用的模型,进行检测识别测试。通过实验结果分析,表明该方法可以有效识别相似时间序列,这在很大程度上减小了采样率多样性对相似时间序列查找的影响。本文的创新性主要体现在:基于分段累合的动态时间弯曲算法中,通过序列的公共子串概念对其进行改进,衰减系数的引入使得该算法在距离值的度量上更加精确;基于深度学习的目标检测算法无需对时间序列进行预处理和长度分割,保持了时间序列的原始特性,通过有效提取原始时间序列的曲线特征,能够直观的、可视化的实现各种长度的相似时间序列识别。