本篇报告为“因子方法论”系列报告第二篇。本文中,东吴金工详细梳理了两类学术界较为前沿的协方差矩阵估计方案。并讨论了其在两个常见案例中的应用。
第一类协方差估计方案为对协方差矩阵非对角线元素做稀疏化(将部分元素压缩到0),该类估计称为稀疏矩阵估计类。第二类协方差矩阵的基本思想为,通过调整样本协方差矩阵的特征值,达到优化估计精度的目的,该类估计称为旋转不变估计类,包括基于仿真模拟的特征值压缩估计,线性压缩估计,以及基于随机矩阵理论的非线性压缩估计。
针对处理矩阵种类的不同,本文也对比了两类方案的估计效果:方案一直接对样本协方差矩阵做稀疏化或旋转不变估计;方案二则对样本相关系数矩阵做稀疏化或旋转不变估计,而后在相关系数矩阵上乘以各变量的样本标准差,得到协方差矩阵的估计。 实证案例一对比了在风险模型中,使用不同方法估计因子收益率协方差矩阵的表现。数值模拟结果显示:对这种因子间收益波动差别很大的情形,使用方案二(相比方案一)更能提高协方差矩阵的估计精度;随着估计使用的样本量增长,各复杂方法相对简单样本协方差矩阵的精度提升幅度逐渐缩小。在实证结果中,各方法下的估计精度并未像预期中一样,随样本量增长而提升,这是由于随着估计所用样本量提高,回看窗口变长,导致估计结果相对于市场变化反应更加迟钝。基于实证结论,我们建议,使用回看窗口126天的方案二下的线性压缩方法去估计因子收益协方差阵。
实证案例二中,本文对比了以最大化复合因子ICIR为优化目标时,各估计方案下的最优复合因子的表现。共选取5个基本面因子与4个情绪面因子纳入因子池。除各种估计方法外,本文还尝试使用不同频率,不同回看时长的因子IC序列作为协方差估计的样本,回看时长及数据频率包括季度(63天、13周),半年(126天、26周、6个月),一年(252天、周、12个月)。结果显示,回看窗口内样本数量越少(月频),复杂估计方法所得到的ICIR比简单的样本协方差矩阵估计下得到的ICIR提高越多。但当回看IC频率较低(月频)时,复杂的估计方法也不能构成对因子等权配置的绝对优势。随着回看频率提升到周频或日频,几乎所有方法都开始大幅跑赢因子等权配置情形。综合实证结论,我们建议使用方案一,回看窗口26周,并配合线性压缩估计或非线性压缩估计去估计IC序列协方差矩阵,该方案下,复合因子年化ICIR高达5.7-5.9,相比于因子等权配置下的ICIR,提升幅度达到30-35%的水平。
风险提示:本报告所有的结论均使用历史数据回测得到,模型在未来存在失效风险。