基于深度学习和股票论坛数据的股票波动率预测精度研究

论坛 期权论坛 期权     
鑫思维   2019-10-19 08:29   2241   0

     上海财经大学陈卫华、徐国祥两位学者在《管理世界》(2018年第1期)发表文章,利用深度学习和股吧发帖数增长率数据对沪深300指数波动率进行样本预测,将预测结果与19种波动率预测模型对比,并用MCS方法检验各模型的预测精度。研究发现:深度学习预测效果明显好于其他预测模型。另外,股票论坛数据对于提升波动率预测精度有所贡献,但是贡献有限。
股票波动率研究主要有三种方法:(1)基于低频数据的历史波动率研究;(2)基于期权定价数据的隐含波动率模型;(3)基于高频数据的已实现波动率模型。
对于波动率模型建模有三个思路:(1)单独利用高频已实现波动率预测,代表性的是ARFIMA和HARA模型。(2)单独利用低频历史波动率预测,代表性的是广义自回归条件异方差模型和随机波动模型。(3)将已实现波动率和历史波动率结合起来进行预测
模型方面:由于股市高频波动率存在长记忆性,而深度学习模型是刻画数据间长记忆性和复杂关系的有效工具。深度学习是人工智能的核心技术,在图像识别、语音识别、自然语言处理等领域应用广泛。深度学习的核心在于各层特征是根据学习过程从数据中直接获得,而不依赖人工特征选择。目前典型的深度学习模型两个:主要用于图像数据处理的卷积神经网络和主要用于时间序列的循环神经网络。长短期记忆模型(LSTM)是循环神经网络结构上加入各种控制门机制,使得模型能够更好的刻画具有长记忆性的时间序列数据。Lecun(2015)已经对深度学习在语音识别和自然语言处理等领域的研究发展进行全面综述。而在金融领域,深度学习的研究才刚刚开始。研究采用的是深度学习中的LSTM模型。

数据方面:国内外大量研究股票论坛的发帖量和投资观点会对证券市场变量(收益率、波动率和成交量)有影响。研究采用了东方财富股吧2008-2016年沪深300成分股发帖量数据(剔除回帖、周末、节假日发帖)和沪深300指数5分钟高频数据(来源于锐思高频数据库)。并将数据分为训练集、测试集和验证集。
波动率估计:已实现波动率估计采用高频收益率平方和来估计,并采用核估计方法修正已实现波动率。
MCS检验:不同损失函数带来不同模型评价结果。研究选择了RMSE、MAPE、RRSE、QLIKE、RLOG和稳健函数这6种损失函数作为评价标准。在实证研究中,单一损失函数下的评价结论存在局限性、不稳健且难以推广到类似样本或者其他损失函数等缺陷。为了克服缺陷,Hansen等(2011)提出了MCS检验法。
       通过对比深度学习模型、ARFIMA族模型、HAR模型、GARCH族模型、SV族模型(共21种模型),深度学习模型预测精度明显好于其他模型,并且通过了MCS检验。
                                                         
      
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:
精华:
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP