递归神经网络RNN
RNN不同于传统神经网络的感知机的最大特征就是跟时间挂上钩,即包含了一个循环的网络,就是下一时间的结果不仅受下一时间的输入的影响,也受上一时间输出的影响,进一步地说就是信息具有持久的影响力。人们在看到新的信息的时候产生的看法或者判断,不仅仅是对当前信息的反应,先前的经验、思想的也是参与进去这次信息的推断的。
RNN之长短期记忆细胞LSTM
LSTM是一种经过精心巧妙设计的RNN网络,尽管LSTM和原始RNN总的来看都会三大层,即输入层、隐含层、输出层。但是LSTM和原始RNN在隐含层设计上有较大的差异,主要是LSTM是在隐含层具备特殊的cell结构。
多因子建模
应用于RNN网络结构中时,与传统的多因子模型有一定的区别: T+1期的收益率仍然是训练的标签(label),因子对应的是样本的特征(feature),个股对应的是一个样本,但是,时间维度,在RNN中,是一个循环的过程,将过去T-n期的因子数据都要纳入T+1期收益率的预测之中。
训练结果
在严格区分了训练集、测试集、样本外数据集之后,我们通过训练能够得到较高准确度的收敛结果,并且在样本外数据回测中,得到显著的超额收益。交叉检验的准确度接近90%,样本外多空收益最近12个月的胜率则超过90%。