在构建多因子模型中,我们常常思考一个问题,不同行业的特性千差万别,我们构造的多因子模型究竟是否适合每一个行业?还是说在有些行业中模型失效,但被统计结果所掩盖了?本篇报告中,我们专门来研究这个问题。
首先,我们选用行业内因子历史RankIC序列构建数据集,对29个中信一级行业进行了K-Means聚类分析,通过聚类结果,我们发现,银行行业最为独立,在绝大多数因子中,与其他行业无法归为一类;非银金融的独立性次之。餐饮旅游、国防军工、石油石化、综合等行业也会在某个因子上与其余行业相独立。除此之外,剩余行业的独立性并不显著。
然后,我们考察了多因子模型在不同行业中的分层效果,模型在大部分行业中体现了较为良好的选股能力,但在某几个行业中的表现却值得关注。其中,银行的分层基本为反向的,证明该模型在银行行业里没能选出表现最好的标的,反而常常选出表现不好的标的。构建一个新的关于银行行业的选股模型成为当务之急。而在有色金属、国防军工、非银金融等行业中,多因子模型的表现也不够理想。餐饮旅游、通信、传媒、计算机、农林牧渔等行业,则是近几年模型出现失效情况。想要构造表现更好的多因子模型,需要重点关注这几个行业的因子收益情况,适当进行模型调整和因子择时。
未来的研究中,我们会尝试在银行行业中使用单独的模型,特别是与银行行业占比较大的指数增强模型相结合,如沪深300、上证50等。至于其他行业,如非银金融、国防军工、农林牧渔、TMT等,也会考虑对模型进行修改,以进一步适应行业特点。
风险提示:随着市场环境变化,模型存在失效风险。