【分享吧】基于线性多项式参数化方法 构建实时预测用的期权隐含波动率曲面(上)

论坛 期权论坛 期权     
上交所技术服务   2019-11-7 10:57   3104   0


摘要
       本文在研究豆粕期权的数据特征和基于线性多项式的波动率曲面模型的适用性基础上,通过改造Dumas的线性多项式模型、提高模型中参数τ的幂级数获得5个本地化模型,并且基于盘中行情数据检验各本地化模型对当前横截面数据的拟合能力和对后续截面数据的预测能力,实验结果表明其中τ的幂级数为2的本地化模型具备出色的样本内的解释能力和样本外的预测能力,能更好地适应豆粕期权波动率的实时预测情况。本研究可为行业提供波动率曲面本地化建模的思路和经验依据。

关键词
       商品期权;期权波动率;隐含波动率曲面;线性多项式模型

Abstract
       This study provides ideas and empirical basis for volatility surface localization modeling. On the basis of studying the data characteristics of soybean meal option and the applicability of volatility surface models based on linear polynomials. In this article, we changed Dumas Linear Polynomial model, by enhancing the power of polynomial of parameter τ, to obtain several models. And based on the market data, we tested these models with different perspectives and the consequences are effective. From the result of the experiments, we developed that as the power of polynomial of parameter τ equaled two, the algorithm presented better ranging from fitness to prediction, which is adapted to establish the model of soybean meal options with intraday quotation.

Key Words
       Commodity option;Option Theory Pricing; implied volatility surface; Linear Polynomial

引言
       证券期货市场盘中稳定机制是指旨在降低证券价格临时波动性的若干机制,全球证券期货市场主要存在静态涨跌停板、动态涨跌停板、单合约波动性中断、主力合约断路器等多种机制,各交易所往往根据自己所处市场的产品特性选择若干机制组合使用。当前国内期货交易所采用静态涨跌停板技术控制盘中价格变动风险,静态涨跌停板机制是指对单一合约的日内成交价格设置一定的波动范围,使其仅可在前日结算价为基准的某一有限的涨跌幅的范围内进行交易。当前国内市场在期权合约上的静态涨跌停板机制,则由“期权合约结算价±标的期货合约涨跌停板幅度”构成检查要素,即不区分期权的价值大小,统一将日内涨跌幅度设置为标的期货合约的涨跌板幅度。在CME[1]、NYSE-LIFFE、NASDAQ-OMX、HKEX在期权合约上普遍实施动态涨跌停板机制,动态涨跌停板制度特点在于2点:①合约的基准价是根据实时的市场价格实时计算;②合约的涨跌停板幅度是根据delta设定的,delta值越小的期权拥有更大比例的涨跌停板幅度;交易系统实时计算基准价,并实时将此和涨跌幅度相加而获得有效的价格申报范围,对新申报的订单价格范围进行限制,超出申报价格范围的订单将直接被系统拒绝,以避免证券价格瞬时波动过大。从这两种机制效果来看,静态涨跌停板限制控制的是日内价格波动,以降低较长时间内的价格波动;而动态涨跌停板机制控制的是单笔交易带来的价格瞬间变化,以缓解非常短的时间内的价格波动。
       具体到技术层面,关键在于如何快速有效地计算出动态涨跌停板的基准参考价格,从CME交易所的公开资料来看,主要有3种方式:① 采用报单前短时间内所有合格的已成交订单的算术平均价格作为动板基准价;② 采用实时期货价格和实时期权delta计算出期权理论价作为动板基准价;③采用隐含波动率曲面定出期权的理论波动率、再利用理论波动率反推的期权理论价格;具体采用何种技术,则取决于期权合约的流动性,在流动性较强的市场中,主要使用前2种方法,在流动性较弱的市场中,则主要使用第3种方法。第3种方法的主要优势是将波动率曲面作为整体来考虑,从而有机会利用不同执行价格的期权波动率之间的相互约束关系定出个别流动性较低的期权合约的波动率。从国内市场实际情况来看,商品期货素有主力合约和非主力合约的区分,主力期货合约流动性较高,非主力期货合约的流动性较低,以非主力月份期货合约为标的期权合约几乎没有流动性,甚至有期权合约在10-20分钟内都没有交易,在这样的情况下采用前2种方式实时计算期权理论价作为期权基准价的方式很可能是行不通的,所以本文拟采用波动率曲面技术定出期权基准价的方法。
       国内关于构建隐含波动率曲面模型的研究主要分为2大类:第一类模型直接利用离散分布的隐含波动率数值构造相对连续且平滑的波动率曲面;毛娟、王建华(2009)则利用S&P500指数期权数据对隐含波动率曲面的非参数拟合方法进行了研究;邓力(2017)基于上证所的ETF期权数据,采用非参数平滑技术的隐含波动率曲面构建方法,获得了更稳健期权估计价格。第二类模型是研究隐含波动率曲面的形态特征和动态时变规律;陈蓉、吕恺(2010)引入了基于小样本面板数据的扩展的卡尔曼滤波法,利用香港恒生指数期权的数据,对隐含波动率曲面的动态过程进行了模拟分析,建立起了一个五因子的随机隐含波动率模型;陈思(2016)基于S&P500指数期权隐含波动率日内数据做实证分析,引入了无损卡尔曼滤波解决了非线性系统的优化问题;陈蓉、赵永杰(2017)采用“两步法”构建了期权隐含波动率曲面的动态模型,并利用该动态模型检验了期权隐含波动率曲面的可预测性。
       从上述文献来看:第一类模型主要是采用非参数拟合方法(即插值法),在内部插值情况下,对于期限较长或者价内外程度较深的期权,由于样本数量稀少且流动性不足,非参数法在隐含波动率,而在外部插值情况下则缺乏成熟可靠的理论方法支持,模型应用受限;上述第二类模型主要是在利用参数方法拟合波动率曲面的基础上,利用VAR模型(向量自回归模型)或卡尔曼滤波模型对参数结果建模,从而获得波动率曲面在时序上的动态相依关系,然而这类模型构建过程相对较为复杂,恐难以在实时计算的环境中使用。
       因此,本文没有采用上述文献中的方法,而是采用经典的线性多项式参数化方法建模。通常波动率曲面建模需要与市场数据特征相适应,模型国外商品期权通常有2个典型特征:(1)期权隐含波动率呈现出微笑曲线[2]的形式,也就是说,价外期权和价内期权的隐含波动率要高于平价期权;(2)相较于长期期权、短期期权的流动性更高,波动率微笑特征在短期期权中亦更加明显。然而与成熟市场相比,国内商品期权市场正处于起步阶段,期权数据特征与国外成熟市场存在差异,主力月份[3]合约期权合约流动性和隐含波动率都高于非主力月份的期权合约,在这种情况下,国外经典的线性多项式模型可能需要进行适度的本地化才会适用于国内商品期权的数据特征。所以本文依次进行了三步研究:第一步研究研究豆粕期权的数据特征,第二步研究根据数据特征构造隐含波动率曲面的方法论;第三步实证研究波动率曲面在临近的时段和临近的合约两个维度上的预测效果。

波动率曲面建模
(一)豆粕期权数据特征分析
       国内外关于波动率曲面的建模研究,通常是通过分析总结期权市场数据的特征规律,并据此提出隐含波动率曲面建模的相关技术和方法。本文取2018年04月1日到2018年4月27日的基本行情数据作为样本,以所有闭市时刻(15:00:00)的横截面为数据分析对象,取买卖报价的中间价作为产生隐含波动率的基准价格[4],并以BAW(Giovanni Barone-Adesi and Robert E.Whaley 1987)定价模型作为期权理论定价模型,采用牛顿迭代法计算出期权的隐含波动率。仔细分析数据特征有下述特征:
       1. 从看涨期权和看跌期权的差异角度分析,主力月份[5]上同行权价格的看涨期权和看跌期权的隐含波动率的差异不大,而部分非主力月份由于期权样本稀疏的关系,导致同执行价格的看涨期权和看跌期权的隐含波动率出现一定程度的差异。
       随机抽取2018年4月20日15点30分的横截面数据作为样本,并抽其中的 m1807、m1809、m1811、m1901的隐含波动率数据画图,如下:

图1 隐含波动率抽样
        由上图可以看出,m1807、m1809、m1901的看涨期权和看跌期权上同行权价格的看期权和看跌期权的隐含波动率的差异不大,而m1811的看涨期权和看跌期权的隐含波动率出现一定的差异。
       2. 从主力月份和非主力月份的差异角度分析,则发现:从整体上看波动率期限结构特征明显,即相较于长期期权、波动率微笑在短期期权中更加明显;同时,期权合约波动率与合约月份的流动性存在一定关系,主力月份的期权合约的隐含波动率要相对高于周边期权合约。
       当2018年04月1日到2018年4月27日的15点30分的数据作为样本,当按照月份和在值程度[6]作为统计维度,分别统计看涨期权和看跌期权的平均隐含波动率,其中:看涨的在值程度可表示为Icall=(S-Kcall)/S,看跌期权可表示为Iput=(Kput-S)/S,I表示期权在值、S表示标的期货价格、Kcall和Kput分别表示看涨期权和看跌期权的行权价格。如下表:
表1 看涨期权的平均隐含波动率(%)

表2 看跌期权的平均隐含波动率(%)

       对比上面2张表,可知:
       (1)以合约期限作为基准,观察不同在值程度的期权隐含波动率,存在平价期权附近的波动率处于低位,实虚两侧的期权的隐含波动率相对较大,总体上呈现微笑特征,存在一定程度的偏斜,除了临近到期的月份外,其它月份的偏斜幅度并不大。
       (2)以在值程度为基准,观察不同合约期限的期权隐含波动率,则同时呈现2方面的特征:①相较于长期期权,波动率微笑特征在短期期权中更加明显;②合约波动率与合约月份的流动性存在一定关系,主力月份的期权合约的隐含波动率要相对高于周边期权合约。
       (3)对比同月份同在值程度的看涨期权和看跌期权的隐含波动率,看涨价外期权的波动率比看跌期权波动率相对稍高。
(二)豆粕期权数据的预处理方法
       在使用隐含波动率数据进行曲面建模之前,通常对数据进行预处理,从而剔除异常数据、降低无风险套利机会。本文的数据预处理的规则如下:
       (1)剔除无成交量、无持仓量、无买价、无卖价的期权数据。
       (2)剔除期权价格小于或等于内涵价值的期权数据。
       (3)因为在临近到期的情况下,期权对期货价格变动过于敏感,所以本文剔除到期日前5日内交易日数据。
       (4)在同系列期权中,取同行权价格的看期权和看跌期权的隐含波动率均值作为构建曲面的隐含波动率。在众多针对国外成熟市场的研究中,大多采用剔除实值期权数据,仅基于平值期权[7]和虚值期权[8]的隐含波动率构建曲面,主要是为平值期权和虚值期权的流动性较大,波动率数据的时效性更优,且因为实值期权[9]的价格主要由内在价值决定,时间价值相对内在价值来说比较小,市场摩擦会对时间价值产生较大的影响,从而使得隐含波动率对市场摩擦比较敏感,易造成较大误差[10]。在国内针对上证ETF50市场的若干研究中,则大多是在同系列期权中,取同行权价格的看涨期权和看跌期权的隐含波动率均值作为构建曲面的隐含波动率,主要是因为ETF50的涨期权和看跌期权的波动率相差较大,取均值有利于提高数据的稳定性。在本文研究的豆粕数据中,由于非主力月份的期权样本稀疏,只取平值期权和虚值期权存在因样本数据过少而降低模型估计精度的问题,所以本文中取看涨期权和看跌期权的隐含波动率均值作为基准波动率。
       (5)在同系列期权的看涨期权中选择最长单调递减子序列,看跌期权选择最长的单调递增子序列作为测算样本,剔除其它期权价格,因为根据无套利曲面规则,同系列期权合约不同行权价格上的看涨期权的价格随着行权价格的增大而单调递减、看跌期权的价格随着行权价格的增大而单调递增。
       (6)本文采用下述方法消除个别值过大或过小波动率对整体的影响:①在系列级别取波动率中位数,并按照(中位数×0.2,中位数×5)建立过滤区间,剔除区间外数据。②取所有月份波动率中位数,若某个合约波动率低于该中位数20%,则剔除该期权价格。
(三)基于线性多项式的波动率曲面建模方法
1
波动率曲面模型选择
       Bernard Dumas, Jeef fleming 和 Robert e. whaley于1998年提出了基于线性多项式参数化的波动率曲面方法:

       其中σ代表估算的隐含波动率,m=log(FK)/√τ,F为期货价格,K为行权价格,τ为期权合约到期期限。β0表示对数隐含波动率的水平值;β1表示隐含波动率σ关于合约期限τ的斜率;β2表示隐含波动率σ关于期权对数价值m的斜率;β3刻画了期权对数价值m与合约期限的相互影响关系,期限不同则隐波动率σ关于期权对数价值m的偏斜程度也可能不同;β4表示隐含波动率σ关于期权对数价值m的曲度;μ表示随机干扰项。
       上面公式认为隐含波动率σ的绝对改变量与期权对数价值m的绝对改变量、期权到期期限τ的绝对改变量之间存在确定性关系,且这种关系在时序上具备一定的稳定性。其中期权波动率σ与期权对数价值m呈2次幂关系表达了实值期权和虚值期权的隐含波动率要相对高于平值期权的隐含波动率的前提假设;而且期权波动率σ与合约到期期限τ呈1次幂关系,则表达了短期期权向长期期权的波动率微笑特征要比长期期权要显著。
       Goncalves Silvia于2004年提出了基于线性多项式参数化的波动率曲面的改良方法:

       上式右侧的各参数的定义与上面(1)式一致,区别仅在于左侧以Inσ代替σ作为因变量, 这是一种线性到对数的模型,表达了隐含波动率的相对改变量(弹性)与期权对数价值m的绝对改变量、期权到期期限τ的绝对改变量之间存在确定性关系。
       那么这两种模型中哪一种更适合豆粕期权数据呢?本文在通过基准模型比对检验后(后文细述)发现公式(1)更适合作为基准模型。且由前文的数据特征分析可知,主力月份的期权合约的隐含波动率要相对高于周边期权合约。因此本文设想在公式(1)的基础上建立多个本地化模型进行回归分析:

       其中:模型A为dumas多项式参数模型;从模型B到模型E,期望通过提高参数τ的幂级数进一步提高模型对数据的拟合程度。
2
模型的参数估算方法
       通常,经典正态线性多项式模型采用最小二乘法法进行线性回归分析,按照残差平方和最小原则估算各参数,比如上面(1)式的残差平方和公式如下:

       其中因变量σk表示实际期权隐含波动率,在本文中由市场价格结合牛顿迭代法计算获得,δk表示按照模型回归拟合获得的隐含波动率估计值。
       当以Inσ作为因变量时,上面(2)式也可采用最小二乘法法进行线性回归分析,残差平方和公式如下:

       其中因变量Inσk表示实际期权隐含波动率的自然对数,表示按照模型回归拟合获得的隐含波动率自然对数的估计值,在求得Inδk的基础上再使用指数函数转换即可获得δk的估计值。
       在给定经典线性回归模型的“假定”下,最小二乘法估计量在所有无偏估计量中具有最小方差,也就是他们是最优线性无偏估计量。在基于横截面数据(波动曲面就是横截面数据)的估计中,最重要的“假定”是出现在回归函数中的干扰项μi是同方差的,即在不同对数期权价值m或不同的合约到期期限τ的情况下,隐含波动率方差相同,即:

       在业界有一种观点认为,期权合约的流动性与期权合约的异方差性有一定的关系,流动性更高的期权合约的隐含波动率方差更小。在期权系列内部,相对于虚实两端的期权合约,平值期权附近的合约流动性相对更大,由此可预期平值附近期权的隐含波动率的方差相对更小一些;在同一品种不同月份的期权之间,相对于非主力月份的期权合约,主力月份合约流动性相对更大,由此可预期平值附近期权的隐含波动率的方差相对更小一些。如果这两种预期正确,可能需要采用加权最小二乘法进行估算,估算公式如下:

       加权最小二乘法通过给与来自于方差更大的样本值以较小的权重比例,给与来自于方差更小的样本更大的比例来来缩小估算误差。如果在主力月份和非主力月份的期权之间出现较为显著的异方差特性,则可通过给与主力月份合约较大的权重;如果在平值期权和虚实两端的期权之间出现较为显著的异方差特性,则可通过给与平值附近期权合约较大的权重。
       由上述分析可知,在既定模型的情况下是否采用加权最小二乘法,主要取决于隐含波动率的数据是否存在异方差。下面2个图表示采用公式(1)构建曲面的情况下残差异方差的抽样分析(2018年4月20日的9:10的横截面数据):

图2 残差异方差分析
       从本图的第1个子图可知,隐含波动率的残差与期权对数价值m之间并没有明显的异方差特征;从第2个子图可以看出,隐含波动率的残差与合约到期期限τ没有明显的异方差特征。为进一步验证,我们基于2018年04月1日到2018年4月27日的定期10分钟采样的横截面数据(截面总数达360个),采用怀特[11](White)检验来确定从A到E这5个模型的是否具有异方差特性。下表为在95%的置信区间内模型无异方差性的截面数量占总体截面数量的比例,如下表:
表3 无异方差性的截面数量占总体截面数量的比例(%)

       二乘法进行参数估计即可。

注释:
[1]在CME该机制叫做PRICE BANDING机制, 详细请看https://www.cmegroup.com/confluence/display/EPICSANDBOX/Limits+and+Banding#LimitsandBanding-PriceBanding
[2]从《derivatives analytics with python》这类书来看,波动率微笑是指虚值期权和实值期权(out of money和 in the money)的波动率高于平值期权(at the money)的波动率的现象,不管数据事实上是否存在偏斜,都叫波动率微笑,所以本文继续沿用波动率微笑这个术语,而没有使用“波动率偏斜”等其它的表述。
[3]豆粕期权是1、5、9月份
[4]因为豆粕期权存在做市商制度,买卖报价相比前成交价更合理,所以取买卖报价的中间价作为产生隐含波动率的基准价格。
[5]豆粕期权的主力月份是1、5、9月份,其它月份为非主力月份。
[6]之所以使用期权在值程度而不是使用期权对数价值作为统计量,主要是因为期权在值程度可以通过简单的手工计算转换为期权执行价格区间,从而便于读者理解和应用。后面所有的分段统计表格都是同样方式处理。
[7]就是期权行权价接近标的期货现价的看涨期权(delta≈0.5),或期权行权价接近标的期权现价的看跌期权(delta≈-0.5)
[8]是指不具有内涵价值的期权,即期权行权价高于期货价格的看涨期权或期权行权价低于期货价格的看跌期权。
[9]就是具有内在价值的期权。期权持有人行权时,对看涨期权而言,期权行权价格低于标的期货价格;对看跌期权而言,标的期货价格低于期权行权价格。
[10]根据陈蓉的《隐含波动率曲面:建模与实证》中的表述,市场摩擦确实是会对时间价值产生影响。
[11]怀特异方差检验是一个横截面数据异常差分析的常规方法,其根本原理是通过建立下面辅助回归:

其中μi为波动率模型回归分析后的残差,然后求出残差的拟合优度统计量R,通过判断n R满足卡方分布的特点建立假设检验分析,据此获得是否具备异方差的判断依据。

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:24
帖子:2
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP