Econometrics Review

引入：为什么需要刻画波动率的模型？

在上一篇文章中，我们讨论的是时间序列水平的建模（例如股票收益率时间序列）。我们的研究对象基于平稳（Stationary）的时间序列进行分析，平稳时间序列，用一句话总结，就是围绕一个水平值以相同幅度波动。用数学语言进行表达，则表现为该序列的无条件均值为常数，且任意间隔的协方差不随时间变动（仅取决于间隔大小）。基于平稳时间序列的良好性质，我们使用ARIMA模型来进一步刻画序列与其过去值的线性关系，这样的跨期线性关系意味着如果给定过往的时间序列，我们可以更加准确地推测未来的时间序列。例如一个AR(1) Process ，对于的预测为条件均值。这里的“条件”就是，也是我们当前拥有的信息。可以这样理解：如果序列之间存在跨期线性关系，那么“条件”就是有信息含量的，可以帮助我们进行短期的预测。（无条件均值与方差作为长期的预测量，有时候并不那么有用）
关于ARIMA模型的回顾，参考
除了时间序列的水平（Level），我们同时还关心序列的波动性（Volatility）。对于一个金融时间序列，波动意味着风险，如果我们能够对于波动本身进行建模，将有利于更加精确地预测时间序列的走向。
注意到，ARIMA模型是对于一个时间序列的条件均值建模，自然地，条件波动率模型（又称条件异方差模型）是针对时间序列的条件方差

进行建模，目的是刻画跨期方差之间的相关性。
到目前为止，我们能够对时间序列进行两个维度的建模。首先是均值方程，用以刻画时间序列的水平特征，其次是波动率方程，用以刻画时间序列条件方差随时间的演变规律。
波动率特征

在现实中我们发现资产收益率序列的波动率存在一些普遍规律，这种规律往往是我们建模的动机。第一，存在波动率聚集（volatility cluster）现象：即波动率在某一些时间段处于较高水平，在某一些时间段处于较低水平；第二，波动率的变化往往是连续的（而不是跳动的），这意味着相邻两个时间节点的波动率可能存在某种关联；第三，波动率并不发散到无穷，这意味着波动率序列往往是平稳序列；第四，波动率对于价格上升和下降的反应有所不同（即所谓的杠杆效应leverage effect），这些现象将指导我们进行合理的建模。
建模步骤

以资产收益率为例，建立一个波动率模型需要以下四个步骤：
（1）通过检验序列相关性建立一个均值方程（如ARIMA模型）
（2）对均值方程的残差进行ARCH效应检验（这里的ARCH即Autoregressive conditional heteroskedasticity），该检验可以初步识别残差项与其残差项滞后序列是否存在线性相关
*存在两种可选的检验方法：Ljung-Box检验或Engle(1982)提出的拉格朗日乘子检验(基于F检验，利用残差项的平方与所有m阶滞后项回归方程的系数联合检验)
（3）若上一步显著，则确定一个波动率模型，并与均值模型进行联合估计
（4）模型选择
Lagrange Multiplier Test for ARCH effect

拉格朗日乘子法的检验基于以下回归

零假设为
定义其中样本均值
定义其中是回归的残差项的平方
构造F统计量

F统计量渐近服从自由度为m的卡方分布
ARCH（Autoregressive Conditional Heteroskedasticity）Model

给波动率建模提供系统框架的第一个模型是Engle(1982)提出的ARCH模型。不同于ARIMA模型中误差项（扰动项）为独立同分布正态序列，为了刻画序列的波动率特征，假设（1）资产收益率的扰动项序列不相关但不独立（放松了独立同分布假定）；（2）该不独立性由滞后值的二次函数来描述。具体地，对于ARCH(m)模型

其中是均值为0，方差为1的独立同分布序列
（除此以外，仍需满足一定条件以保证误差项序列的无条件方差有限）
ARCH模型中最直观的一点是：过去的较大的平方扰动会导致新息（innovation）有取值较大的倾向（注意：的取值既包括这部分“继承”，也包括随机的内容），这种倾向是为了刻画“波动率聚集”现象
为什么ARCH模型长这样？

ARCH模型直观地描述了波动率聚集的现象（即大的冲击影响会持续），但我们仍然会疑问，为什么ARCH模型就长这样？虽然和ARIMA有点像，但其实也听不像的。带着这个疑问，我翻了好几本书，终于找到了合适的答案，沿着直观的建模思路，看看怎么一步步走到Engle提出的模型形式
首先，我们想要时间序列的波动性是随时间变化的，最直观的方式就是引入一个独立的变量来描述这种波动性，自然地，建立模型
其中为方差恒定为的白噪音序列
如果序列为常数列，那么序列就是白噪声过程，但是如果序列不完全相等，你那么基于过去信息，当期的条件方差为
上述式子自然地描述了条件异方差，两边取对数，就可以得到一个线性方程

该模型可以进行OLS估计。但是，这个简单的模型缺点也很明显，首先，导致序列异方差的变量几乎凭空产生，难以找到合理的理论依据来解释它的出现，也无法排除其他的备择冲击，其次，这个变量还会影响到的均值（而不是只对波动率进行建模）
是否有更好的模型形式呢？最好是能不引入新的变量的情况下，同时对序列的均值和方差进行建模。
考虑一个平稳的时间序列
条件方差为
我们发现条件方差是扰动项的平方的条件期望值，如果此时条件方差不是常数，且跨期的条件方差之间存在线性相关，最容易想到的就是针对条件方差建立自回归(AR)模型，也即是将扰动项的平方序列视为AR过程

其中为白噪声过程
上述模型已经体现了ARCH模型的思想（也可以视为ARCH模型），但其以线性形式出现，不利于使用MLE同时对条件均值和条件异方差进行估计，此外，线性干扰项不如乘法干扰项易处理（引自Enders, W. (2014).Applied econometric time series（Fourth Edition）. John Wiley & Sons. Page125）
因此Engle(1982)提出的ARCH(1)模型为

ARCH(1) Model

的无条件均值
推导的关键在于已知即可以确定

的无条件方差

利用了的平稳性，上式也意味着
这里我们还关注更高阶矩的性质，例如，为了研究的尾部性质，要求四阶矩有限

该结果表明，由于四阶矩为正，
且该序列的无条件峰度为
这意味着该序列的尾部比正态分布更“厚”，即更容易出现异常值
ARCH模型的局限性

ARCH模型虽然已经很好地刻画了部分我们观察到的金融时间序列，但仍存在一些不足：

过去时间内正的扰动和负的扰动都以相同的幅度影响当前以及未来的波动率（扰动以平方的形式存在），但在现实中，正与负的扰动往往带来的是不同幅度的影响
ARCH模型为了保证各阶矩的有效性，对参数加以的限制过多，当模型为高阶模型时，这样的约束会变得复杂，也限制了模型的解释力
ARCH模型同样无法帮助找出时间序列变动的来源，只是机械地刻画了这个过程（Remark：这个要求是不是偏高了，在有限的信息下模型能刻画波动率的变动规律已经很好了）
ARCH模型对于一些孤立的冲击可能反应过度

模型估计（以ARCH(2)为例）

的PDF为（假设服从正态分布，均值为0，方差为1）

联合似然函数为

我们需要使用两步估计的流程。首先使用MLE估计收益率序列的均值方程，然后得到残差序列，第二步使用MLE估计残差序列对应的GARCH模型。MLE在大样本情形且误差项为正态时是最优估计，即使误差项不是正态，也可以得到不错的估计（QMLE）
注意：在GARCH模型中，条件异方差是被infer出来的，通过式子

来实现，与联合极大似然估计同时实现，最终得到序列
估计的稳健方差协方差矩阵为
模型检验
构造标准化的残差
如果模型识别正确，那么该变准话的残差序列应该为独立同分布序列，可以分别使用Ljung-Box统计量来检验均值方程与波动率方程，与分布相关性质可以使用偏度、峰度或PP（QQ图）等方法来检验
预测

One-Step Forward

Two-Step Forward

GARCH（General ARCH） Model

虽然ARCH模型简单，但是为了充分描述资产收益率的波动率过程，往往需要很多参数。Bollerslev(1986)提出广义ARCH模型，一个GARCH(m,s)模型使得条件方差由m阶新息平方滞后项与s阶方差滞后项决定，即

其中
以及以保证无条件方差有限
由上述模型，我们认为未来的方差由三部分组成：长期的无条件方差、过往的新息以及过往的方差
以GARCH(1,1)为例

也可以写成

根据方差序列的平稳性，两边取期望得

易得是保证平稳性的必要条件
波动率方程可以改写为
此时可以明显地看到：未来的方差由三部分组成：长期的无条件方差、过往的新息以及过往的方差
考虑均值方程
无条件均值为
无条件方差为
无条件三阶矩为
无条件四阶矩为

由可得

因此均值方程的峰度为

自相关函数为
根据上面的统计量特征，我们可以简单总结，GARCH模型刻画了随时间变化的条件异方差，该异方差在水平值上下波动，且存在波动率集聚现象。与此同时，收益的分布是厚尾的，但没有表现出左偏或右偏
预测

进行MLE以后，我们可以得到参数的估计值与序列
进一步地，进行预测，往前一步预测为

往前两步预测为

这意味着当预测期趋于无穷时，条件方差的预测收敛于无条件方差

接下来简要介绍一些拓展模型
GARCH-M Model

在金融序列中，有时候收益率取决于序列的波动，因此我们需要在均值方程中加入序列的波动（条件方差），模型为

估计出来的参数称为风险溢价
这个模型也提供了金融时间序列数据存在序列相关的依据之一
GJR-GARCH and EGARCH Model for Asymmetric Volatility

至今我们的模型仍未能解决收益率波动的杠杆效应，即对于正的冲击和负的冲击反应不同，为此，我们建立GJR-GARCH模型刻画这一特征

另外一个解决该问题的尝试是EGARCH模型，其原理是对当期的冲击进行建模，使得负冲击影响更大
基于以上模型，可以得到收益率的左偏分布，但是长期来看该效应会消失（由于中心极限定理），因此模型的选择取决于时间序列的样本期
一些金融的Insight

为什么价格会变动？
价格反映了信息，由交易推动价格变动
为什么价格会有波动？
价格波动反映了新的信息，这些信息的重要性以及出现的频率不同导致了波动的不同，现实中的经济变动也会反映到资本市场中，体现为收益率的波动
Reference

Tsay, R. S. (2005).Analysis of financial time series. John Wiley & Sons.
Wei, W. W. S. (1990).Time Series Univariate and Multivariate Methods. Pearson Addison Wesley.
Enders, W. (2008).Applied econometric time series. John Wiley & Sons.

期权匿名回答 · 2022-7-8 06:40:08

学习了[赞同]

Econometrics Review

1 个回复