1、 长久以来,选股与择时都是量化金融领域面对的两个最主要的问题。多因子模型是在量化选股中最常用的模型,在之前的报告中,我们详细介绍了这一模型。然而2017年以来,市场分化逐渐显著,靠选股获得alpha收益的难度越来越大。这时,我们就需要依靠择时模型来减小规避系统性风险,减小策略回撤。
2、 随机森林算法是一种机器学习分类算法。它通过训练样本生成大量决策树,综合所有决策树的分类结果得到最终决策。相比于其他机器学习算法和传统线性回归模型,随机森林算法具有直观,参数少,抗干扰,不易出现过拟合等优点。将随机森林算法引入择时模型,可以减少主观判断对于择时结果的影响,挖掘市场更深层次的运行规律。
3、 将28个申万行业指数作为择时标的,提取41个有效因子,以2010-2016年数据为样本集,2017年-2018年数据组为验证集,建立择时模型。模型平均准确率54.48%,2017年至今平均超额收益15.03%,平均择时净值1.07,平均减少最大回撤11.73%。在28个行业中,有25个行业的择时结果强于指数,取得超额收益的概率高达89%。2017年至今,市场呈现较为明显的分化局势,仅7个行业收益为正,21个行业都有不同程度下跌。择时后,收益为正的行业增加至20个,且剩余8个收益为负的行业净值相比不择时的情况都有了大幅提升。
4、 根据择时结果,可建立行业轮动模型,每周调仓。在大部分行业普遍回调的情况下,模型依然取得了正收益。最终轮动模型年化收益4.4%,超出上证综指5.7%;最大回撤10.7%,小于上证综指的14.6%。
5、 在未来,我们还计划陆续推出行业内的多因子选股模型。该模型和行业内选股模型相结合,可以达到自上而下择时选股一体的优化结果,得到更灵活、更细致、更有针对性的量化模型。
6、 风险提示:随着市场环境变化,模型存在失效风险。