论文部分内容阅读
处于经济信息中心位置的股票市场,经过一系列的交易,汇集了众多领域的商业信息,对股票的未来状况进行预测一直是股市参与者关注的热点。在股票的众多指标中,价格是最直接的指标之一。对股票价格进行预测对股市参与者有重要意义,一方面它能使投资者合理配置资源进行理性投资,另一方面它能促进股票价格合理波动,发挥经济晴雨表功能。但股票市场受诸多因素的影响,价格数据展现出非平稳、非线性、高度嘈杂等特征,如何合理运用这些特征找到合适方法进行预测始终是一个值得不断探索研究的问题。本文以沪深300指数日收盘价数据为研究对象,采用三种方式对其建模预测。一、对非平稳的收盘价数据建立ARIMA模型。收盘价经过一阶差分之后变为平稳时间序列,因此可以建立ARIMA模型进行预测。二、对非平稳的收盘价数据建立LSTM模型。不再关注收盘价数据是否平稳,选用对数据无要求的神经网络模型——长短时记忆网络进行预测。由于所研究对象为一维数据,因此预测窗口长度的选取由收盘价的自相关系数决定。三、对收盘价数据进行分解,建立LSTM-ARM4A模型。采用奇异谱分析将收盘价分解为相互独立的趋势项和波动项,趋势项非平稳,对其建立LSTM模型,波动项平稳,对其建立ARMA模型,两部分预测结果之和作为收盘价的预测值。对三种预测结果进行分析,LSTM-ARMA的预测效果最好,ARIMA次之,LSTM最差。组合模型的预测效果优于单一模型,理论上最不符合数据特征的ARIMA模型取得了不错的预测效果,虽然LSTM模型的预测结果最差,但其预测值更为平滑,且从对时间序列分解得到的更为平滑的趋势项的LSTM预测结果来看,LSTM模型可能更适合用于平滑数据的预测。组合模型得到了最好的预测效果,归功于将时间序列分解为更为简单、特征更为明确的子序列。本文采用的时间序列分解算法——奇异谱分析是近年来兴起的一种研究非线性时间序列的非参数方法。将窗口长度设置为数据量的三分之一,以此来构建轨迹矩阵,对轨迹矩阵进行奇异值分解处理,得到原始数据相互独立的多个分量,奇异值不同,所对应的分量含有原始数据的信息不同。本文根据各分量的累计贡献率将分量进行组合,得到收盘价数据的两个独立子序列——趋势项和波动项。由实证结果表明,分解后的子序列更容易被抓取特征,得到更好的预测结果。通过本文的整体描述,可以了解在股指价格预测方面哪一种方法适用性更好,为以后的股指价格预测提供技术选择方面的支持。本文的预测取得了比较理想的结果,可以为市场的参与者提供相对客观的数据预测支持。