论文部分内容阅读
股市投资由于其自身所具有的准入门槛低、盈利上限高等特点,一直以来都是备受关注的研究热点。中国股市是一个以个人投资者为主的市场,通过对股市相关舆情的实时追踪,研究其中所蕴含的情感倾向,在某种意义上能够洞悉股民的心理状态,那么理论上可以针对性地构建出一套舆情投资策略用于实际交易。本论文提出了一种全新的基于机器学习的舆情追踪投资策略。首先,通过记录特定关键词在百度指数、微信指数、微博微指数等第三方平台上的实时搜索结果,感知行情冷暖。更进一步地,通过采集股票论坛中的帖子,自主定义生成每日股评情绪指数,把握人性脉动。通过爬虫和光学字符识别技术的有机结合,本文提出的方法大幅提高了数据收集系统的运行稳定性。针对现有算法在文本情绪识别精度上的不足,本研究通过仔细选择训练样本并精心设计网络结构,以充分发挥不同机器学习模型的优势,利用集成学习思想开展情感预测。相比现有算法,本研究提出的模型能够取得更高的文本情感分类精度。最后,结合搜集得到的舆情数据,本研究组合生成多种舆情交易策略。经过在历史行情数据上的回溯测试,筛选出表现最好的基于综合舆情指数反转策略的交易模型。实验结果表明,相比于比较基准,其具有较好的超额收益获取能力和风险抵御能力,验证了舆情策略对于实际投资的效果。