论文部分内容阅读
股票价格看起来具有很强的不确定性,但是国家政策、行业信息以及公司财务指标等情况都会影响到股票市场的趋势。根据这一特征,如果投资者能够了解到这些情况是如何影响股价变动的,就能够减少因股价不确定性的大波动导致的投资带来的损失,甚至是获得意想不到的收益效果。对于政府来说,进行股价去世的预测也是政府进行宏观经济调控,预防突发状况的方面之一。因此如果能够对股市进行事先的分析预测,无论对投资者、企业、投资机构还是政府相关政策的制定都具有重大的现实意义。随着金融大数据时代的到来,金融量化分析在我国未来金融市场中的应用将发挥越来越重要的作用。本文基于沪深300股票价格指数,使用隐马尔可夫模型以及支持向量机模型进行建模。本文实证过程主要包括选取合适时间段的股票相关数据、最优预测因子组合确定、对模型参数训练以及对测试集回归预测等步骤。本文一开始引用多日加权的隐马尔可夫模型对沪深300指数价格进行预测,通过实验结果对比分析,确定使用10日加权隐马尔可夫预测模型进行接下来的研究。接下来使用10日加权隐马尔可夫预测模型在120个预测因子的组合中进行预测,根据预测的效果选择不同梯度的预测因子组合。然后在不同梯度的预测因子下,运用支持向量回归模型预测股价。我们选择高斯核作为支持向量机的核函数,因此在进行预测之前我们要先确定高斯核函数的参数g以及支持向量机的惩罚参数C,参数的确定方法本文选择交叉验证的方法,让C和g在一定的范围里跑(比如C= 2-5,2-4,...,25,g=2-5,2-4,...,25),然后选择预测准确率最高的但C最小的那组C和g作为最优参数。确定好最优参数后使用滚动预测的方法进行股价预测,即若预测第t日收盘价,则以第t-30(40、60)日至第t-1日的日交易数据为训练集,以第t-29(39、59)日至第t日的日交易数据为测试集,这样反复滚动预测。之后我们再利用均方误差(MSE)和平方相关系数(DS)评价预测结果。从结果中我们可以发现在对不同天数进行预测时,40天往往是最优预测天数,而且HMM模型得出的最优预测因子的组合(成交量,MA10,MA60)在支持向量回归模型中也有非常良好的表现,它们的表现甚至超过了以开盘价、最高价、最低价为特征向量的预测结果。本文所得的实证结果均是在特定条件、特定对象以及特定时间下得到的,因此对于模型的适用性本文尚未做分析。在具体进行投资分析时,还是应该具体情况具体分析,以保证预测的准确性。