论文部分内容阅读
时间序列预测(Time Series Prediction)是数据挖掘中的一类典型问题,被广泛应用在经济、气象、通信、医疗等领域。作为概率统计学科中应用性较强的一个分支,时间序列分析有比较完整的理论系统。自回归模型AR(n)、滑动平均模型MA(m)、自回归滑动平均模型ARMA(n,m)以及非平稳的ARMA(n,m)模型[1][2]等线性模型,对于实践都有极为重要的指导意义。但对较为复杂、非线性的时间序列(例如时序股票数据),这类模型的预测结果不能满足实际的需求。在时间序列预测中,股票预测一直被认为是当前时间序列预测中最具挑战性的应用之一,受到数据挖掘界的广泛关注。
随着神经网络(Neutral Network)的兴起,不少研究者都把它运用在时间序列分析上,提出了很多有用的模型,随着研究的深入,人们逐渐认识到它存在收敛速度慢、易陷入局部极小点等缺点,同时模型受网络结构复杂度和样本复杂度的影响较大,有时会出现学习或泛化能力过低的现象。
近年来出现遗传算法与神经网络算法相结合构成的混合遗传算法,因为遗传算法(GA)是模拟生物进化过程的全局优化搜索算法,利用GA的全局搜索优化BP网络的结构、权值参数,可以有效克服BP算法的收敛速度慢、易陷入局部极小点、鲁棒性不高等缺点,所以混合遗传算法有十分广泛的应用。
随着演化算法的发展,基因表达式(GEP)结合了遗传算法(GA)的简单线性染色体的思想和遗传程序设计(GP)中使用的大小和形状不同的分叉结构思想,是GA和GP的一种必然的发展。在解决时间序列、符号回归等问题上,有无法比拟的优越性。
已有学者把GEP算法应用在股票指数时间序列分析上,取得比较理想的结果。本文在此基础上进行了改进,提出基于GEP的BP神经网络,通过股票指数收盘价验证,得出该混合模型比单独使用BP神经网络效果更好,预测精度更高,误差更小。
本文的主要工作包括:
(1)提出了基于主成分分析(PCA)的遗传神经网络股票指数预测算法,使用主成分分析法选取输入变量,并将GA-BP混合建模应用于沪市综合指数预测中,有效克服了神经网络的缺陷并成功地应用于股票指数预测研究中。
(2)提出了基于GEP的BP神经网络(GEP-BP)算法
用基因表达式编程技术构建BP神经网络的结构和权阈值,得出最优的神经网络的结构和权阈值。此方法避免了一般神经网络依靠经验确定网络结构的困难,为神经网络进行预测建模提供新的思路和方法。
(3)将GEP-BP预测沪市综合指数收盘价
相同的股票数据下,应用GEP-BP与BP神经网络分别对上证指数进行了预测。通过实验结果比较,得出了GEP-BP具有较好的预测性能,表明了GEP-BP算法在股票预测效果上比BP神经网络方法好,精度上比BP网络高。