本篇报告是HMM指数择时系列研究报告的第二篇--理论篇,我们在上一篇实战篇的基础上,首先回顾了HMM三大算法:概率计算算法、学习算法及预测算法;同时,我们也提供了五个案例解析。其次提出了基于无监督学习HMM评估方法,得到dist是一个很好的评估模型估计误差、状态估计精度及状态估计稳定性的指标。最后,我们根据dist值进一步对上一篇报告中的观测变量日收益率指标进行反思,同时把日MAshort/long指标和日收益率指标进行对比,根据dist的大小与对的敏感度,得出当训练长度足够长时,日MAshort/long指标较日收益率指标更适合作为HMM的观测变量。
1、HMM通常是用Baum-Welch算法估计参数,而Baum-Welch算法并非是一个全局最优的算法,因此如何评估HMM模型的解和真实的解的差距?我们通过构造“最小距离”--来刻画HMM的参数估计误差和状态估计精度。
2、HMM在进行预测的时候,我们希望预测的结果(例如隐状态)从事后来看尽可能是稳定的,因此我们可以定义一个状态的稳定性指标。通过我们的研究发现,“最小距离”与稳定性指标具有较强的线性相关性。
3、对于上一篇报告中,我们通过最大化收益回撤比的方式选择以日收益率作为观测变量,隐状态个数选择为14,那么究竟这个指标是不是一个稳定的指标呢?我们做了研究,发现其实当隐状态个数越多的时候,稳定性越差。同时,我们也给出了隐状态的个数大致在3~5是比较合适的。
4、基于对日收益率序列的反思,我们提出一个新指标,该指标的特点是在短期内变化具有趋势性,而长期又具有平稳特性。该指标变化慢,而且分布不像收益率那样“尖峰厚尾”。当训练的样本足够多时,该指标对隐状态个数的选择就没有很强的依赖性。
