结构化(多因子)风险模型中,怎样理解因子暴露度,在实践中如何得到它?

论坛 期权论坛 期权     
匿名用户   2018-10-13 00:23   11659   10
提示: 作者被禁止或删除 内容自动屏蔽
分享到 :
0 人收藏

10 个回复

倒序浏览
2#
陈不机智  3级会员 | 2018-10-13 00:23:04 发帖IP地址来自
恰好,这两天在做相关的东西,简单来说一下。

结构化风险模型在APM这本书说的比较清晰了,也可以看一下Barra的USE3的handbook,都对这一类模型进行了比较细致地讲解,题主问的因子暴露度实际上就是排第一答案说的factor loading,即通常意义上的因子载荷,包括基本面数据,行情数据,财务数据得到的相关因子数据,将这些因子数据去异标准化之后,再根据当期的个股收益就可以截面回归得到对应的因子收益率,这样就将个股的收益分解为了其对应的因子收益乘以相应因子载荷加上其个股特质收益。

对于对冲模型来讲,由于对于所有个股来讲,因子收益都是相同的,区别在于不同的因子载荷(或者直接说因子暴露),所以将组合的所有个股的风格因子载荷得到之后,即可以将其对应于对冲标的Benchmark的因子载荷,从而通过将组合载荷和对冲载荷的difference的大小来暴露你期望的风险,控制你不需要的风险。
3#
BigQuant  2级吧友 | 2018-10-13 00:23:05 发帖IP地址来自
既然已经了解了结构化多因子模型,那么想必知道组合管理的一部圣经之作:《主动投资组合管理:创造高收益并控制风险的量化投资方法》
pdf下载地址为
主动投资组合管理 创造高收益并控制风险的量化投资方法(原书第2版)美) 李腾;杨柯敏.pdf - 下载 - 人大经济论坛
在这本书中,介绍了风险结构模型的来龙去脉。风险结构模型主要来自于APT。建模如下:



从这个模型可以看出,该模型是用多个因子去解释股票收益率。直接采用多元回归模型。X是组合的因子暴露度,b表示因子的收益率。因子暴露度是各个股票在各个因子上的实际数据,只是需要去极值、标准化处理。在实践中怎样获取参考下图:


这里是以美国股票数据举例,成长性、规模、ROE、Beta、债券beta就是用来解释股票收益率的几个因子。那么,这几个因子的实际数据即为股票的因子暴露度(需要去极值、标准化处理)。获取因子暴露度以后,就可以进行横截面回归获取各个因子的因子收益率。
最后,顺便提一句,BigQuant平台即将上线组合管理工具,Barra 风险结构模型直接可以在BigQuant - 你的人工智能量化平台 上菜单化操作实现。
4#
文兄  3级会员 | 2018-10-13 00:23:06 发帖IP地址来自
其实就是一个权重,一个系数,或者你可以认为是一种beta
5#
flyerye  2级吧友 | 2018-10-13 00:23:09 发帖IP地址来自
以下解释尽可能让读者通俗易懂。若显不专业,请包涵,也欢迎指正。
先来理解什么是因子暴露度。我们从最简单的CAPM模型讲起:


这里,
是股票i的收益,
是市场收益,
是股票 i 相对于市场的超额收益,而
是股票 i 相对于市场收益的暴露。这里的暴露可以理解为股票 i 相对于市场的杠杆。比如,
, 我们可以理解为,当市场收益增加1%的时候,股票 i 的收益增加1.2倍,即1.2%。当然,这里的杠杆和我们人为的加杠杆不一样,这是由股票内在的风险相对于市场的风险计算而得,我们可以把它看做一个天然的杠杆。
现在我们透过现象看本质。首先在讲暴露的时候,我们要定义一个空间(Universe)。我们在用CAPM模型的时候,往往是直接使用公式,却忽视了背后的一些假设。我们之所以用
去表示
,是因为两者在同一个空间,只不过
是这个空间全体的代表的某种表示。举个例子,如果你要研究一个食品类的股票,你可以选择用沪深300,这时候你看的空间是整个市场。你也可以用食品行业的指数,这时候你的空间就是这个特定行业。但是,如果你的空间锁定在特定行业,你就不能用金融行业的指数,这样你很可能得到暴露为0,结果没有意义。所以在理解暴露之前,先要有空间(Universe)的概念。
下面我们来看多因子模型


CAPM模型其实是多因子模型的特例,表现为它只有一个因子,且这个因子被定义为市场收益。如果你能找到更多的解释因子,你就可以构造一个如上所示的多因子模型。和CAPM模型相似,这里
是股票 i 在因子 j 上的收益,而
是股票 i 在因子 j 上的暴露 (回忆天然杠杆的概念)。下面用实例来进行剖析,并且来讲怎么计算。假设,一个股票的解释因子有EP和BP。EP和BP是市盈率和市净率的倒数。那么上面的等式可表示为:


计算暴露的时候,我们要先计算股票 i 本身的因子值,即EP和BP的值。接下来,请回忆空间的概念。在构建多因子模型之前,很重要的一步是确定股票池。这里股票池就是你的投资空间。所以当计算完个股的EP和BP值之后,我们要相对整个股票池的EP和BP,分别进行标准化处理(下面等式以EP为例):


这里
是在股票池中所有股票的EP的平均数,
是在股票池中所有股票的EP的标准差。通过标准化公式,你可以看到暴露度其实是股票 i 在该因子上相对于选定空间的一种量级体现。这时候可能有的专业人员会说,这样的因子暴露计算方法太简单了,除了标准化,还要进行截尾(truncate)和中性化(neutralization)等处理。但其实,得到暴露度的过程中,标准化是必要的。截尾和中性化等处理是为了得到一个更稳定,且加入因子间相关性考虑的因子暴露度,换句话说,是为之后因子的使用,进行优化处理。
另外,以笔者个人经验,很多对多因子暴露度理解不是很清晰的朋友,可能是对时间序列回归(Time series regression)和横截面回归(cross sectional regression)的概念不太清晰。因为在多因子模型搭建中,计算暴露度是横截面回归,这里和CAPM这样常用的时间序列回归模型找暴露度,理解上不一样。如在这方面有困惑,欢迎提问。
6#
PKUXuelin  4级常客 | 2018-10-13 00:23:10 发帖IP地址来自
Nah..
他问的不是"怎么理解因子暴露度”吗,你们回答的好像是“怎么得到因子暴露度”。首先你要搞清楚你的RHS Variable是什么,是因子收益率,换句话讲是一个Portfolio Return。所以对Regression Coefficient(也就是你的x_{n,k}(t))最浅显的理解是,你的LHS Return有多少是来自于某个Portfolio k。
但我们真正关心的不是Portfolio per se,而是这个Portfolio代表的Underlying Risk。换句话讲,你的RHS Portfolio可以定义为所有Company Name以A开头,B开头..Z开头。你也可以去做一个这样的Regression也有可能有Significant Coefficients。But who cares?
所以你选的Portfolio往往带有一定的特征,而且你或许可以理解这些特征表象下的所带有的Risk。比如,你Small Company, High Leverage Company, High R&D Company..etc。你认为你选择的这些Portfolio各自代表了某些风险,x_{n,k}(t)这个时候的解释实际上是你所建立的LHS Portfolio受到来自第k种RHS Portfolio所代表的Risk的影响程度(exposure)。
BTW, 把Factor Model翻译成因子是很蛋疼的一件事。
7#
Davy Zhu  4级常客 | 2018-10-13 00:23:11 发帖IP地址来自
楼上的答案都解释了什么是因子暴露度,但好像都没介绍怎么计算这些因子暴露度。个人觉得,仅仅把他认为是因子的权重,不够深入。我的理解是:

一个因子的因子暴露度,是你在这个模型中考虑纳入该因子时所承担的风险。你认为这个因子是有效的、是能带来收益的,那么你必然要承担这个期望的风险。


这说得有点抽象了,我们来举个例子:

假设此时,你认为一只股票(S)的因子A对下一期(t+1)的股票收益率有影响。于是你将这个因子加到收益率预测的模型中,并通过某种方法(方法的介绍见下文),计算得到该期的因子暴露度为0.5(假设),假设此时因子A的值为0.3。这什么意思呢?意思就是你认为在其他因子对股票收益率没有影响的情况下(也就是如果下一期股票的收益率只受该因子A的影响),该股票下一期的收益率就是0.3*0.5=0.15。如果如果如果如果你的想法错了,这个因子在下一期一点用都没有。假设实际上其他因子确实不影响股票收益率,那么此时股票收益率为0%,你将承担那高估15%的后果。(夸张点举个例子:你跟客户打包票说你下个月买的100万股票一定会涨15%,不涨我就赔给你,那你就准备好掏那15万吧)
这就是我所理解的因子暴露度,你想要因子暴露出多大程度的收益,暴露出多大的风险,他们其实是等价的。


至于怎么计算因子暴露度,其实各家有各家的方法,由于大家能选择的因子基本都那个范围,选股模型的优劣很大程度取决于因子的筛选和因子暴露度的设置。方法之间孰优孰劣还是通过回测结果来比较,然而并不能保证未来是否有效。我这里简单的列出几个常见的吧。

1. IC加权法:这个方法其实是目前各大量化部门比较常用的。最简单的是对各个因子在横截面上和因子收益率计算rank IC,然后前N期的因子值和前N-1期的因子收益率做回归计算得到beta。用各个因子的rank IC对对应beta做加权得到各个因子的因子暴露度。现在还加入了各种花样,例如引入半衰期的概念,认为因子IC对因子暴露度的影响应该像半衰期一样递减;也有将多期IC平均之后再和beta相乘,也有用像计算EMA的办法来计算IC,也有将IC的变化和累加的IC图做比较之后判断因子是否实效来计算权重。

2. 历史经验法:有人用前N期的因子值和股票收益率数据做OLS来计算因子暴露度。也有人直接简单粗暴地主观设置固定的因子暴露度(我真的在研报里见过。。)
8#
guiping sun  4级常客 | 2018-10-13 00:23:12 发帖IP地址来自
barra模型中关于风险因子的稳定性检验时,需要计算相邻时间的相关系数,里面用到了回归权重,这个回归权重具体指什么?怎么计算?
9#
匿名用户   | 2018-10-13 00:23:13 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
10#
匿名用户   | 2018-10-13 00:23:14 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
11#
艾程远  2级吧友 | 2018-10-13 00:23:16 发帖IP地址来自
中文版APM,page 165 结构化模型1中的情况。因子暴露就是例如基本面、宏观或其他因子类别,page 157 有个例子。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:24326
精华:1
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP