基于深度学习的复杂时间序列预测模型研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:qipini
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:医学中的时间序列数据常常具有结构复杂、数据量大、维度高、非线性程度高,并含有噪声信息等特点。传统的时间序列分析方法已经很难满足这种复杂时间序列的分析和预测,而循环神经网络等深度学习方法的出现为复杂非线性、非平稳时间序列的预测提供了新的思路。本研究基于循环神经网络构建了两种新的组合预测模型,以期为进一步提高复杂非线性、非平稳时间序列的预测精度提供方法学支持。
  方法:(1)本研究结合神经网络模型优化和时间序列分解两种策略,提出了两种基于循环神经网络的复杂时间序列预测方法。其中均使用一种特殊的循环神经网络,即GRU神经网络作为预测方法的基础模型,用以解决时间序列数据自相关的问题。
  (2)对于神经网络的结构参数选取困难的问题,采用群智能优化算法中的三维混沌果蝇优化算法(V3CFOA)对GRU神经网络进行参数优化。V3CFOA算法结合了混沌算法来增加初始果蝇种群的多样性,并将果蝇优化算法的二维搜索空间改进为三维,增大了搜索范围,提高了收敛速度,从而使算法的全局寻优能力增强。本研究基于此方法,将构建V3CFOA-GRU组合模型,并通过实例分析,与其他优化算法和GRU神经网络进行对比分析,验证该组合预测模型的有效性。
  (3)考虑到复杂时间序列的高噪声和非平稳性等特点,本研究从信号分解的角度着手,采用改进的集成经验模态分解(MEEMD)方法将原始复杂序列分解成不同频率、相对简单的信号(子序列),再使用GRU神经网络进行分析预测,来达到提高预测精度的目的。MEEMD方法基于序列的时域局部特征来自适应的分解序列,通过添加成对白噪声和设置排列熵检测,来解决模态混叠和重构误差大等问题,能够简单而高效的分解序列。本研究将构建基于MEEMD的GRU预测模型,并通过实例分析,与其他分解方法和GRU神经网络进行对比分析,验证这种组合模型的有效性。
  (4)实例分析数据来源于北京美国驻华大使馆监测站收集的5年每个小时的PM2.5污染物浓度和气象数据(BeijingPM2.5数据集),序列总长度为43824小时,共有PM2.5浓度、露点、温度、气压、风向,风速和累计下雨、雪的小时数8个特征变量。本研究通过使用过去一段时间内的8个变量来预测未来一小时的PM2.5浓度,训练集和测试集以3:1划分。
  (5)本研究中,预测模型的评估指标为均方根误差(RMSE)、平均绝对误差(MAE)、对称平均绝对百分比误差(SMAPE,%)和决定系数(R2),前三种误差指标的值越小,说明模型的预测效果越好;决定系数值越接近1,说明模型的拟合效果越好。
  结果:(1)构建了V3CFOA-GRU预测模型。使用V3CFOA方法对GRU的超参数(时间窗口大小和隐藏层单元数)进行优化,选择测试集的RMSE作为V3CFOA的适应度函数,找到使RMSE最小的一对最优超参数。再使用最优超参数构建GRU模型进行训练和预测,并评估模型的预测效果。
  (2)验证了V3CFOA-GRU预测模型的有效性:对比分析相同超参数设定(时间窗口为12小时,隐藏层单元数为80)下的GRU模型、标准RNN和LSTM模型,实验结果表明,相比于标准RNN获得了24.24的RMSE、14.22的MAE、30.63%的SMAPE和0.92的R2,以及标准LSTM获得了23.54的RMSE、12.84的MAE、21.99%的SMAPE和0.93的R2,GRU模型的RMSE、MAE、SMAPE和R2分别为23.29、12.50、20.08%和0.93。这说明了GRU模型的预测效果比LSTM和RNN更好。
  对V3CFOA-GRU与FOA-GRU、PSO-GRU、GRU模型的预测结果对比分析,结果显示,FOA-GRU的RMSE、MAE、SMAPE和R2分别为22.13、11.78、20.05%和0.93,PSO-GRU获得了22.74的RMSE、12.07的MAE、19.91%的SMAPE和0.93的R2,都比GRU模型的预测结果更好。相比之下,V3CFOA-GRU的预测效果最好,得到超参数时间窗口大小和隐藏层单元数分别为8和72,获得了21.27的RMSE、11.32的MAE、19.47%的SMAPE和0.93的R2。
  (3)构建了MEEMD-GRU预测模型。先使用MEEMD把原始序列分解为多个本征模态函数(IMF)分量和一个剩余分量。再分别对每一个分量使用GRU模型进行训练和预测,将各分量的预测结果集合得到最终的预测结果。
  (4)验证了MEEMD-GRU预测模型的有效性:首先比较EMD和MEEMD的分解结果,EMD分解得到了19个分量,而MEEMD得到了16个分量。两种分解方法的剩余分量的变化图表明了在5年内PM2.5浓度有明显上升的趋势。
  接着对比分析了MEEMD-GRU与EMD-GRU、GRU模型的预测结果,结果显示,GRU获得了23.26的RMSE、12.34的MAE、19.87%的SMAPE和0.93的R2,而EMD-GRU的RMSE、MAE、SMAPE和R2分别为15.78、9.66、21.78%和0.97,MEEMD-GRU的RMSE、MAE、SMAPE和R2分别为14.73、8.89、19.94%和0.97。对比结果表明,MEEMD-GRU模型的预测效果最好。
  (5)对比MEEMD-GRU和V3CFOA-GRU的预测结果:实验结果表明,MEEMD-GRU模型的预测效果比V3CFOA-GRU模型更好。
  结论:与单纯使用GRU神经网络预测和其他的组合模型相比,本研究提出的V3CFOA-GRU组合预测模型和MEEMD-GRU组合模型的预测效果较好。此外,结合序列分解方法的GRU模型的预测性能明显优于结合参数优化方法的GRU模型,这提示我们先对复杂时间序列进行数据处理,降低序列的复杂度后再进行预测分析,可能对进一步提高这类数据的预测精度非常有帮助。两种方法在复杂含噪声、非线性、非平稳时间序列预测上都表现出较高的预测精度,我们可以根据具体的应用场景和实际数据质量等,选择合适的预测方法。
其他文献
第一部分金属复合暴露水平与糖尿病风险的相关性研究  目的:研究金属复合暴露水平与糖尿病风险的关联性。  方法:研究对象基于深圳市老年相关疾病队列(Shenzhen Aging Related Disorder Cohort)的基线人群(n=9411,≥60岁),该基线人群完成了健康问卷调查和健康体检。当剔除本研究中涉及变量信息缺失者〔包括教育水平(n=90)、主动吸烟(n=48)、被动吸烟(n=3
目的:评估武汉市18-30月龄儿童智力及运动发育现状,探讨影响儿童智力及运动发育的相关因素,为今后促进和改善儿童认知发育水平和运动发育水平提供参考依据。  方法:随机选取2018年7月至2019年12月在武汉市江岸区妇幼保健院和二七街社区卫生服务中心进行常规体检和疫苗接种的295名18-30月龄儿童为研究对象,通过自行设计的儿童智力及运动发育影响因素调查问卷,对其家长进行问卷调查,随后采用贝利婴幼
学位
目的:锶是人体必需的微量元素之一,饮水及食物为人体锶的主要来源,现有研究表明,锶为人体骨代谢所必需的营养元素,但其在糖脂代谢中的作用尚不明确。本研究旨在探究血浆锶水平与2型糖尿病(type 2 diabetes mellitus, T2DM )、糖调节受损(impaired glucose regulation, IGR)之间的关系,并进一步探索锶与糖脂代谢的关系及血浆钙锶稳态与T2DM、IGR的
学位
阿尔茨海默病(Alzheimer’s disease, AD)是一种进行性中枢系统神经退行性疾病,其主要病理特征是细胞外β-淀粉样蛋白(Amyloid-β,Aβ)聚集沉积形成的老年斑,细胞内Tau蛋白过度磷酸化形成的神经原纤维缠结和神经元丢失。其中,Aβ在AD的发生发展中发挥关键的作用。研究发现其可通过下调脑源性神经营养因子(Brain-derived neurotrophic factor, B
目的:多酚类化合物在预防慢性非传染性疾病中有重要意义,准确评估中国成年人膳食多酚摄入水平及其变化趋势是探究多酚类化合物与慢性非传染性疾病发生发展关系的基础。然而,截止到目前尚未见类似的研究报道。因此,本研究旨在评估中国成年人膳食多酚摄入水平及其变化趋势,为后续研究多酚类化合物的健康效应提供必要的基础数据。  方法:本研究利用1997、2000、2004、2006、2009和2011年CHNS膳食调
目的:通过病例对照研究,了解妊娠期糖尿病(GDM)孕妇和非GDM孕妇肠道微生物的特点;比较GDM孕妇和非GDM孕妇肠道微生物组成的差异;探索影响肠道微生物相对丰度的其他因素。  对象与方法:研究对象为2016年11月至2018年7月纳入同济母婴健康队列(TMCHC)且已行葡萄糖耐量试验(OGTT)的妊娠中晚期(孕24周后)孕妇。经知情同意,共收到20个非GDM孕妇(对照组)和19个GDM孕妇(病例
目的:调查早期创伤、人格特质、心理弹性和抑郁症状在武汉市青少年中的现况,探讨早期创伤与青少年抑郁症状关系及人格特质和心理弹性在其中的作用,为青少年抑郁症预防和干预提供依据。  方法:2015年9月至2016年1月,采用整群抽样法抽取湖北省武汉市5所小学(5-6年级)、3所初中(7-9年级)以及2所高中(10年级)10-17岁在校中小学生。采用自编一般情况调查表、流调中心用抑郁量表(CES-D)、儿
学位
目的:本研究评估了中文版《适应障碍自评量表》在我国癌症群体中的信效度,并应用该量表研究女性乳腺癌患者适应障碍的流行病学特征,探索运动和社会支持对女性乳腺癌患者发生适应障碍的影响,为《适应障碍自评量表》在我国的使用推广以及女性乳腺癌患者适应障碍的早期筛查、诊断和干预提供依据。  方法:本研究分两个阶段进行,均采用方便抽样的方法。第一阶段,选取武汉市同济医院病程在1年内的214名大肠癌患者进行电话随访
学位
目的:调查武汉市青少年早期创伤、心理弹性及抑郁症状的现况,探讨早期创伤、心理弹性与青少年抑郁的关系;通过对NPY基因多态性的检测,分析NPY基因变异与抑郁症状的关联,并研究NPY基因多态性与早期创伤的交互作用对青少年抑郁症状的影响,以及心理弹性在基因、早期创伤和抑郁关系中的作用,为青少年抑郁症状的预防和干预提供理论依据。  方法:采用整群抽样的方法,于2015年9月至12月,对湖北省武汉市3所小学
研究背景:近年来越来越多的研究关注于母亲产后抑郁与儿童体重之间的关系,但仅有少数队列研究探讨产后抑郁对儿童早期BMI_Z以及超重/肥胖的影响。此外,最新研究表明,腺苷酸环化酶3(ADCY3)基因突变可导致单基因严重肥胖。然而,母亲产后抑郁与ADCY3基因位点在儿童肥胖发生间的相互关系尚不清楚。为了进一步了解母亲产后抑郁与ADCY3基因以及两者的相互作用对儿童早期肥胖的影响,本研究将分为两部分进行探
学位