基于LSTM深度神经网络的智能选股策略研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:lygzzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
上世纪70年代,股票交易市场的计算机化,促成了计算机智能选股策略的问世。2012年后,以深度学习为核心的人工智能,则开启了智能选股的新时代。智能选股就是使用计算机对市场上不同股票的各项特征信息进行分析,对股票的未来价格做出预测后,自动地选择股票进行最优化交易。因此获取有价值的影响股票价格的特征变量,能够使计算机更精准地预测出股价的未来价格,做出优质的选股策略,从而获得超额的投资收益。然而目前大多数研究者在选取影响股票价格的特征变量时,主要选取的是个股的历史交易信息、各项技术指标以及公司的财务数据,忽视了其他重要的影响股票价格的特征变量,使得股价预测模型无法更加准确地预测出股票的未来价格。
  本文以2016年1月5日至2020年1月23日上证50指数中29绩优股作为样本,从风险和舆情的角度出发,创新地引入个股收益的偏度、峰度,并对东方财富股吧论坛的投资者评论进行文本情感分析,分别构造出了风险指标、舆情指标以衡量个股风险和量化投资者情感倾向。为量化投资者的情感倾向,本文创新地将投资者情绪分为个股投资者情绪和行业投资者情绪,从东方财富股吧网上分别爬取了个股和行业的股评数据。在对股评数据进行降噪处理后,从中抽取部分数据,通过人工标注的方式,构建了包含16664条投资者评论的语料库。同时本文对现有的中文分词表和停用词表进行了扩充。在对个股和行业的股评数据进行分词和去除停用词的基础上,本文使用Word2Vec模型的skip-gram架构进行词向量的训练,随后通过计算得到句子向量,并输入至LSTM深度神经网络模型对股评信息进行情感分类。同时本文建立了支持向量机模型、随机森林模型、逻辑回归模型以及基于这三种模型的集成学习模型,与LSTM情感分类模型进行对比分析。本文将所有模型进行五折交叉验证,通过模型评估指标F1值选取最优情感分类器。实证结果表明,LSTM情感分类模型的分类预测F1值为70.48%,均高于集成学习模型的分类预测F1值69.27%、支持向量机模型的分类预测F1值69.17%、随机森林模型的分类预测F1值67.58%、逻辑回归模型的分类预测F1值69.23%。
  随后本文构建了一个双层LSTM深度神经网络股价预测模型以探究常用的技术、财务指标与本文构建的风险、舆情指标对股价预测模型的影响。本文将以交易指标为输入变量的股价预测模型作为基础模型,并将技术、财务、风险、舆情指标分别与交易指标进行组合后分别输入至股价预测模型中,以平均百分比误差作为模型评估指标,分析了各项指标及其组合对模型预测的影响。实证结果表明,以交易指标、技术指标、风险指标和舆情指标作为输入变量的模型,比仅以交易指标作为输入变量的模型的预测平均百分比误差降低了11.30%。同时实证研究发现,当输入变量加入财务指标后,模型的预测平均百分比误差均有不同程度的增加。
  为进一步提高LSTM深度神经网络股价预测模型的精度,本文将交易、技术、风险和舆情指标作为模型的最优输入变量,分别从神经网络层数量、神经元个数、batchsize大小、优化器的选择与训练样本长度方面对该模型进行优化。同时本文构建了基于支持向量回归的股价预测模型,并使用网格搜索法进行惩罚系数C和gamma值进行调优。随后本文将参数调优后的LSTM股价预测模型和SVR股价预测模型进行对比分析,结果表明参数调优后的LSTM股价预测模型的误差更小,准确度更高。
  最后本文将29只股票的最优输入变量、交易指标分别输入至参数优化后的LSTM股价预测模型中进行收盘价格预测,在此基础上构建了两种选股策略。本文设置的选股策略回测时间为2019年5月20日至2020年1月23日、2019年7月23日至2020年1月23日,通过对比不同回测时间的两种策略回测结果,发现以本文选取的最优输入变量和LSTM深度神经网络股价预测模型为基础构建的选股投资策略,能够获得比大盘风险相对更低、收益更高的投资回报。
  本文构建的投资者情感分类模型、LSTM股价预测模型以及智能选股投资策略,对量化投资者情感、预测股票价格和制定选股投资策略有一定的参考意义,并能够在一定程度上帮助投资者进行投资决策,提高投资收益。
其他文献
创新对于企业乃至整个国家来说,都起到至关重要的作用。一方面创新提高企业的生产效率及市场竞争力;另一方面创新提高整个国家的科学技术水平,推动经济的发展。相对于个人投资者来说,机构投资者拥有资金、信息、专业方面的优势,他们更有动力和能力参与公司治理,从而对上市公司乃至整个资本市场都产生不容忽视的影响,加之近些年来国内外机构投资者发展十分迅速,已经成为资本市场上必不可少的参与者,因此成为现代学者研究的主
学位
随着中国资本市场发展,股权质押受到许多上市公司的欢迎,当股价被高估时,处于融资困境的上市公司会更有可能采用股权质押融资方式。股权质押行为不转移股东的所有权,但会导致控制权和现金流权分离,质押期间的现金收益(股息红利等)归质权人所有。质权人根据评估的股权价值设置相应的预警线与平仓线水平。股权质押融资效果与股市表现息息相关,股价下跌将直接导致股权价值下降,当股权价值低于平仓线,出质人无法及时补充或赎回
学位
自Schumpeter(1942)和Solow(1957)以来,技术创新一直被认为是经济增长的的重要引擎,与Solow将技术进步视为外生变量不同,Schumpeter将技术进步归功于具有创新精神的企业家建立的企业。而随着知识经济和创新驱动时代的到来,企业创新对于提升企业自身的价值和竞争力开始具有越来越显著的作用。因此无论是从中国经济转型的角度看,还是从提高企业自身竞争力的角度来看,鼓励企业进行更多
学位
在经济全球化和金融一体化的大背景下,如何有效管理并防范金融风险是每个国家乃至每家企业都必须面对与解决的重要问题。目前,金融领域的风险主要分为市场风险、信用风险、流动性风险和操作风险四大类,其中尤为值得重视的是信用风险,因为信用风险涉及到财务困境、交易违约甚至是企业破产,严重的还会引发金融危机。另一方面,银行是中国经济金融体系的主体部门,而商业银行又是银行部门的核心,对于社会运行和经济发展起着十分重
学位
资本资产定价一直以来都是金融学发展研究的核心。有关资本资产定价的理论研究与实证研究一直都在进行与发展。其中,Markowitz(1952)首次提出风险投资模型,即均值-方差模型,将风险概念化为方差,将收益概念化为均值。随后,Sharpe(1964)、Lintner(1965)和Mossin(1966)于资产组合理论等研究基础上发展出CAPM,对资产预期收益率与风险进行了进一步地研究。然而,仅假设收
学位
大宗商品包含了能源、金属和农产品等用于生产和消费的各种商品,能够跨地域大量流通。大宗商品对经济的发展有着至关重要的作用,但其在全球范围内的分布极不均衡。所以一直以来,大宗商品都是国际贸易中非常重要的组成部分。与此同时,国际大宗商品的价格波动较为频繁,且通常幅度较大。其价格的非预期变化会对各国的进出口贸易和国际收支产生直接影响,并通过多种传导途径,最终影响各国的宏观经济。经济的发展离不开物质基础,国
学位
随着现代化经济的日益发展,上市公司成为中国经济的“引擎”,现代企业的董事会承担着制定公司战略决策、提供咨询意见的咨询职能和对管理层的监督职能,重要性无可比拟。然而,因为董事会管理不当造成的负面事件屡见不鲜,如在安然事件中,因为董事会没有严格履行监督职能,导致发生财务造假事件,最终造成公司破产。又如在2012年,南纺股份董事会监督不力导致总经理独揽大权,形成十年来国企造假第一案,还有之前屡屡被曝光的
学位
改革开放之后,中国的GDP总值一直处于上升的趋势,但GDP增速从2010年之后开始逐渐放缓。在中国逐渐丧失人口红利,经济增长放缓的阶段,经济发展到了“新常态”。国家推出供给侧结构改革,全面推行“三去一降一补”政策,其中要在“稳增长”的工作前提下进行“去杠杆”,这也正说明在经济发展过程中改善债务结构、防范化解金融风险是当前的主要任务。由此可见,当前的经济发展方针既要追求稳定的增长,也要稳妥地考虑到金
学位
贫困问题是世界性难题。一直以来,传统金融发展在减缓贫困中发挥了重要作用,是“造血式”减贫的有效手段,但其也存在金融排斥等问题,无法有效的满足小微企业、农村居民和城镇低收入人群等一些弱势群体的金融服务需求。近年来,快速发展的数字普惠金融,依托于大数据、人工智能、互联网等技术,在客户触达、产品设计、风险管理等方面打破了传统金融的服务边界,有效缓解了金融排斥等问题,成为金融减贫的新手段。  四川省作为西
本文主要研究2008年实施的《劳动合同法》对企业全要素生产率的影响。《劳动合同法》基于此前的《劳动法》对企业做出了更加严格的限制,加强了对劳动者的保护力度,但同时也对企业的经营活动产生一定影响。因为全要素生产率较为全面地衡量了企业的技术创新、制度环境、管理技能、生产技术水平,可以帮助更好地研究劳动保护对企业的影响及《劳动合同法》实施的经济后果,因此本文选择企业全要素生产率作为研究指标。通过分析劳动