统计套利中的「协整」是什么意思?

论坛 期权论坛 期权     
我不知道啊   2018-10-17 22:30   12777   9
有没有可以帮助解释下?最好是已经实现过的策略。
分享到 :
0 人收藏

9 个回复

倒序浏览
2#
法派锐士  4级常客 | 2018-10-17 22:30:46 发帖IP地址来自
当一个金融产品的价格序列具有平稳性(stationarity)的时候,它会表现出均值回复(mean-reverting)的特性,从而创造出非常好的投资机会:一旦股票价格走低到均值之下,买入等待它回升到均值;反之亦然。然而在金融市场中,原始的时间序列往往是非平稳的。所以我们能做的是找到两个(或者两个以上)的价格序列,虽然它们每一个都是非平稳的,但是它们的某种线性组合表现出平稳性。这就是2003年诺贝尔经济学奖获得者Enger和Granger提出的协整(cointegration)的概念,这样的序列对(组)称为协整序列对(组)。
统计套利:理论、算法和策略
统计套利:理论、算法和策略(二)统计套利策略中的协整分析方法

3#
BigQuant  2级吧友 | 2018-10-17 22:30:47 发帖IP地址来自
直观理解
协整是什么这个问题回答起来不是那么直观,因此我们先看下图,了解一下具有协整性的两只股票其价格走势有什么规律。

                          图1  两只协整股票的走势图1  两只协整股票的走势
从图1中可以看出,两只股票具有同涨同跌的规律,长期以来两只股票的价差比较平稳,这种性质就是平稳性。如果两个股票具有强协整性,那么无论它们中途怎么走的,它们前进的方向总是一样的。
平稳性
提到协整,就不得不提平稳性。简单地说,平稳性(stationarity)是一个序列在时间推移中保持稳定不变的性质,它是我们在进行数据的分析预测时非常喜欢的一个性质。如果一组时间序列数据是平稳的,那就意味着它的均值和方差保持不变,这样我们可以方便地在序列上使用一些统计技术。我们先看一个例子,了解平稳和非平稳序列直观上长什么样。



                        图2  平稳序列和非平稳序列图2  平稳序列和非平稳序列
图2中,靠上的序列是一个平稳的序列,我们能看到它始终是围绕着一个长期均值在波动,靠下的序列是一个非平稳序列,我们能看到它的长期均值是变动的。
问题的提出
由于许多经济问题是非平稳的,这就给经典的回归分析方法带来了很大限制。在金融市场上也是如此,很多时间序列数据也是非平稳的,通常采用差分方法消除序列中含有的非平稳趋势,使得序列平稳化后建立模型,比如使用ARIMA模型。
1987年Engle和Granger提出的协整理论及其方法,为非平稳序列的建模提供了另一种途径。虽然一些经济变量的本身是非平稳序列,但是,它们的线性组合却有可能是平稳序列。这种平稳的线性组合被称为协整方程,且可解释为变量之间的长期稳定的均衡关系。协整(co-integration)可被看作这种均衡关系性质的统计表示。 如果两个变量是协整的,在短期内,因为季节影响或随机干扰,这些变量有可能偏离均值,但因为具有长期稳定的均衡关系,它们终将回归均值。
协整应用在量化投资中
基于协整的配对交易是一种基于数学分析交易策略,其盈利模式是通过两只证券的差价(spread)来获取,两者的股价走势虽然在中途会有所偏离,但是最终都会趋于一致。具有这种关系的两个股票,在统计上称作协整性(cointegration),即它们之间的差价会围绕某一个均值来回摆动,这是配对交易策略可以盈利的基础。当两只股票的价差过大,根据平稳性我们预期价差会收敛,因此买入低价的股票,卖空高价的股票,等待价格回归的时候进行反向操作从而获利。
需要特别注意的是协整性和相关性虽然比较像,但实际是不同的两个东西。两个变量之间可以相关性强,协整性却很弱,比如说两条直线,y=x和y=2x,它们之间的相关性是1,但是协整性却比较差;方波信号和白噪声信号,它们之间相关性很弱,但是却有强协整性。



                                       图3  相关性很弱,但是具有强协整性
[h1]平稳性和检验方法[/h1]严格地说,平稳性可以分为严平稳(strictly stationary)和弱平稳(或叫协方差平稳,covariance stationary等)两种。严平稳是指一个序列始终具有不变的分布函数,而弱平稳则是指具序列有不变的常量的描述性统计量。严平稳和弱平稳性质互不包含;但如果一个严平稳序列的方差是有限的,那么它是弱平稳的。我们一般所说的平稳都是指弱平稳。在时间序列分析中,我们通常通过单位根检验(unit root test)来判断一个过程是否是弱平稳的。
一个常见的单位根检验方法是Dickey-Fuller test,大致思路如下:假设被检测的时间序列Yt满足自回归模型Yt=αYt1+t ,其中α为回归系数,t为噪声的随机变量。若经过检验,发现α
4#
优矿量化实验室  4级常客 | 2018-10-17 22:30:48 发帖IP地址来自
来上一个带案例的协整教程。


原帖地址:基于时间序列的协整关系的配对交易   作者:minghong


Why
统计套利之配对交易是一种基于数学分析交易策略,其盈利模式是通过两只证券的差价(spread)来获取,两者的股价走势虽然在中途会有所偏离,但是最终都会趋于一致。配对交易就是利用这种价格偏离获取收益。具有这种关系的两个股票,在统计上称作协整性(cointegration),即它们之间的差价会围绕某一个均值来回摆动,这是配对交易策略可以盈利的基础。通俗点来讲,如果两个股票或者变量之间具有强协整性,那么不论它们中途怎么走的,它们的目的地总是一样的。


What
经典回归模型是建立在平稳数据变量的基础之上的,对于非平稳变量,不能使用经典回归模型,否则会出现虚假回归等诸多问题,但是实际应用中大多数时间序列是非平稳的,1987年Engle和Granger提出的协整理论及其方法,为非平稳序列的建模提供了另一种途径。虽然一些经济变量的本身是非平稳序列,但是,它们的线性组合却有可能是平稳序列。这种平稳的线性组合被称为协整方程,且可解释为变量之间的长期稳定的均衡关系。
需要
  1. 特别注意
复制代码
的是协整性和相关性虽然比较像,但实际是不同的两个东西。两个变量之间可以相关性强,协整性却很弱,比如说两条直线,y=x和y=2x,它们之间的相关性是1,但是协整性却比较差;方波信号和白噪声信号,它们之间相关性很弱,但是却有强协整性。




How

这里还有介绍一个关于时间序列的基本概念:平稳性。平稳分为两种:强(严)平稳:给定随机过程X(t),t属于T,其有限维分布组为F(x1,x2,…xn;t1,t2,…,tn),t1,t2,…,tn属于T,对任意n任意的t1,t2,…,tn属于T,任意满足t1+h,t2+h,…,tn+h属于T的h,总有F(x1,x2,…xn;t1,t2,…,tn)=F(x1,x2,…xn;t1+h,t2+h,…,tn+h);宽(弱)平稳:给定二阶矩过程(二阶矩存在)X(t),t属于T,如果X(t)的均值函数u(t)是常数,相关函数R(t1,t2)=f(t2-t1)即相关函数只与时间间隔有关。我们通常用的都是弱平稳
单整阶数:当原序列是非平稳的,需要对序列进行差分(后一项减前一项),直到为平稳序列,差分几次就是几阶。
协整关系存在的条件是:只有当两个变量的时间序列{x}和{y}是同阶单整序列即I(d)时,才可能存在协整关系(这一点对多变量协整并不适用)。因此在进行y和x两个变量协整关系检验之前,先用ADF单位根检验对两时间序列{x}和{y}进行平稳性检验。平稳性的常用检验方法是图示法与单位根检验法。
下面举个栗子,我取了601169北京银行 ,601328交通银行两只股票,看它们在2013年一年的时间序列是否存在协整性





先定单整阶数,即检验平稳性,作差分,直到序列平稳。这里检验平稳性用的是ADF单位根检验法,原假设为序列具有单位根,即非平稳,对于一个平稳的时序数据,就需要在给定的置信水平上显著,拒绝原假设。也就是说Pvalue很低时,序列平稳。





可以看出两只股票的P值都还高,不能拒绝原假设,即数据非平稳,下面做一阶差分以后,再检验平稳性



一阶差分以后,两个序列就已经平稳了,他们的单整阶数都是一,所以是单整同阶的,下面就可以做协整了:这里的原假设是两者不存在协整关系。



p值低于临界值,所以拒绝原假设,两者存在协整关系。
接下来就可以根据两者的协整关系做配对交易了。先画出两者的差价序列

这样,如果可以卖空的话,一个最简单的配对交易如下:
1.spreadprice大于1.7452时,卖空差价,即卖空601169北京银行,买入601328交通银行。
2.spreadprice小于1.4573时,买入差价,即买入601169北京银行,卖空601328交通银行。
3.spreadprice靠近零时,平仓
A股市场无法卖空个股,对于无法卖空个股的A股市场,上述配对交易策略中的卖空改为卖出即可。下面我们来实现上述策略,看看这两支股票的配对交易在2014年里的表现:





总结
上述过程重在描述理论,以供大家研究,结果不是太重要
期货回测即将开启,或许这种统计套利的方式在期货市场也有用武之地。
量化之路漫漫其修远兮,吾将上下而求索。



原帖地址:基于时间序列的协整关系的配对交易   作者:minghong
其他参考贴:
学习:协整配对交易
协整性的进一步讨论
搬砖的理论基础:配对交易 Pair Trading


5#
munlin  3级会员 | 2018-10-17 22:30:50 发帖IP地址来自
以纯实践的角度试答。

一个稳定的交易策略基本上要在时间和标的两个维度增加博弈次数:
时间维度代表:高频交易,夏普10+,如经常提到的 virtu 1000多个交易日只亏损个位天数
标的维度代表:日频统计套利,夏普2.5+,如我工作过的Millennium,股票标的持仓 3000+

这里介绍的基于协整的pair trading,是一个很狭义的统计套利思路,而且在实践中几乎没人直接这样做,因为在时间和标的两个维度上都没有优势,计算上成本和交易上的误差,偏差较大,机构不会大量的配置此类策略。

pair trading 其实就是一个简单的均值回归模型,沿着这个思路,大家可以参考:

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1015987
What Happened to the Quants in August 2007? Amir Khandani,Andrew W. Lo

比较经典的一篇关于均值回归实践的文章,里面用一个简单的策略来替代被各种多空对冲基金采用的均值回归模型(及其各种变种):
-每日看空组合:过去一个交易日想对涨的最多的N支股票
-每日看多组合:过去一个交易日相对跌的最多的N支股票
对比基于协整的pair trading,这个策略在时间维度(每日换仓)及标的维度均有增加,不过也只是较为粗糙的版本。有兴趣的可以试一试测试,回头有空再写基于这个思路比较精细化的策略表现。
6#
王力  4级常客 | 2018-10-17 22:30:51 发帖IP地址来自
查文献cointegration
7#
伐木鼎鼎  3级会员 | 2018-10-17 22:30:52 发帖IP地址来自
回答得都d太复杂了,谁能来个简单的?
已知序列A和B存在协整关系, 如何求系数k和b使得    B = k*A + b ?
8#
刘美琪  4级常客 | 2018-10-17 22:30:53 发帖IP地址来自
协整是研究非平稳数据的建模方法,
有些数据是非平稳的,
但是进行线性组合后可能就平稳了,或者长远来看可能就平稳了,
这些数据之间就称为就有协整关系。
统计套利中的协整,还是参照最高票答案吧。嘻嘻。
9#
余量  1级新秀 | 2018-10-17 22:30:54 发帖IP地址来自
看完上面的这些答案,觉得大家对理论的东西分析的比较到位。当然很多是书上揭示的,大家都能看到的。就没有人谈谈这个方法的执行性的问题吗????
至少有两点,大家都没有提:(1)交易手续费对这个方法的影响。(2)通过Johansen Test计算得到的对冲系数和统计值。这两个是很关键的问题,如果没有搞清楚,都是纸上谈兵。
10#
哈德逊河畔的鹅  3级会员 | 2018-10-17 22:30:55 发帖IP地址来自
其实统计套利的核心是要构造出stationary的process,不论是通过Cointegration还是CCA(Canonical Correlation Analysis),或者更fancy的方法(我也不知道)得出。至于最终你用什么模型去fit residual,O-U process还有时间序列的那些模型,都可以试试效果,没有哪个模型就是完美的,有时候越简单效果反而越好。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:7
帖子:7
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP