论文部分内容阅读
量化投资是金融市场上一种新兴的投资方法,其通过数学模型和计算机程序进行投资决策,具有纪律性、分散性和效率性等优点。在量化投资领域,多因子模型凭借其简单、高效、可塑性强的特点深受业界和学界的欢迎。在使用多因子模型构建选股策略时,可以将其分为因子选择和回归模型构建两个部分。传统多因子选股模型大多从上市公司的财务数据出发,选择市值、市盈率、净资产收益率等财务指标因子来挖掘公司的基本面信息,但是财务数据往往存在滞后性,当市场风格发生转变时容易带来较大亏损。针对这一问题,本文参考业界的最新做法创新性地构建了包含估值、质量、成长、动量、情绪和技术等六大类因子的因子池,有效的利用了股票市场上的交易数据,可以更加快速和全面地分析影响股票未来收益率的因素。此外,传统多因子模型使用多元线性回归来拟合因子同股票收益率的关系,无法有效容纳那些与收益率非线性相关的因子。对此,本文使用机器学习中的Boosting算法来代替传统的回归模型,构建了基于Boosting算法的多因子量化选股模型。此外,相对于传统的静态模型,本文采用滚动训练的方法构建动态选股模型,更能适应市场风格的变化。在参数优化的过程中,采用了比网格搜索和随机搜索更快捷的贝叶斯优化算法,提高了建模的效率。对于构建的选股模型,本文使用2014年至2019年沪深300指数和创业板指数成份股的数据进行实证分析,将Adaboost、GBDT、XGBoost、LightGBM等Boosting算法下的细分算法同传统线性回归模型进行对比。实证结果显示,不论Boosting算法模型还是传统线性回归模型都能够获取超过沪深300指数的收益,并且Boosting算法的表现总体上要优于传统线性回归,这说明利用Boosting算法改进传统线性多因子选股模型的思路是可行的。在文章的最后,本文使用收益波动率加权的方法进一步提升了模型的盈利能力,从而得到一个较为完善的投资策略。