论文部分内容阅读
多变量时间序列是多个变量在一段时间内有序的观测值记录,作为一种复杂的结构化对象,其具有高维、变长、多变量之间相互依赖等特点。典型的用于处理序列数据的状态空间模型(如循环神经网络)常常将每个时刻的多个变量视为一个整体学习状态表示,然而这种策略不能直观地利用各个变量间的交互关系。多变量间的依赖关系可能有助于揭示多变量时间序列的动态特性,提供更好的数据表示,提高分类准确性。针对以上问题,本文基于一种非线性状态空间模型——回声状态网络,结合格兰杰因果关系机制,提出一种利用回声状态网络的非线性动态映射来学习多个变量之间的因果关系的算法。算法为每个多变量时间序列学习一个模型,并在分类任务中采用函数模型间的距离来评估原始多变量时间序列之间的相似度。为了进一步限制模型参数的稀疏性,本文定义了焦点序列,即对多变量时间序列全局生成机制影响最大的变量子集构成的序列,并设计算法寻找焦点序列。在标准数据集上的实验验证了本文所提算法的分类有效性,并直观地展示了多个变量间的格兰杰因果关系。实验表明学习到的模型参数具有更好的稀疏性和可解释性。本文的具体工作如下:(1)提出了一种利用回声状态网络的非线性动态映射来学习多个变量之间因果关系的算法。该算法可以显式地利用多个变量间的关系,为原始多变量时间序列学习可信的表示。(2)设计了赋予模型更多解释性的焦点序列和寻找焦点序列的算法,提高了模型参数的稀疏性。(3)针对分类任务,本文采用模型空间的距离作为多变量时间序列相似性的度量标准,计算原始多变量时间序列间的模型空间距离,使用参数无关的模型代替多变量时间序列可以有效地避免不等长多变量时间序列带来的问题。(4)在标准数据集上的实验结果表明了本文算法具有较好的分类准确度和鲁棒性。