【财通金工】“拾穗”多因子(七):从纯因子组合的角度看待多重共线性

论坛 期权论坛 期权     
量化陶吧   2019-4-2 17:33   10395   0
投资要点
  从纯因子组合的角度看待多重共线性
        对因子有效性的评价通常有分组法、Fama-Macbeth方法、简单因子组合法和纯因子组合法。
        简单因子组合衡量的是组合每增加一个单位因子的暴露对组合收益的影响情况;纯因子组合衡量的是在剔除其他因子的影响之后,每增加一个单位的目标因子暴露能够给组合带来的风险溢价。
        在财通金工多因子模型中,因子之间的VIF系数小于3,说明多重共线性的问题并不严重。但从因子权重系数FWC、因子收益相关系数FRC和因子杠杆率LEV来看,部分行业和风格因子仍然会明显受到其他因子的影响。
  市场风格解析
        整体来讲,在过去的一个月中,高Beta的股票、前期涨幅较高的股票能够获得相对较高的收益,而大规模、高换手、高波动的股票后市走势将会出现更为明显的回撤。
  指数风险预测
        所有样本指数在未来一个月的年化波动区间在22%-31%之间,相较上周略有上涨,财通金工特别提醒投资者注意当前市场的波动情况。
  指数成分收益归因
        上周市场风格以大盘股为主,表现最好的三只指数都是大盘指数,其在规模因子和长期动量因子上暴露较多,而表现较差的三只指数更多得偏向于中小规模股票,其在非线性规模因子上的较大暴露拖累指数收益。
风险提示
        本报告统计结果基于历史数据,过去数据不代表未来,市场风格变化可能导致模型失效。
更多交流,欢迎联系财通金工张宇,联系方式:17621688421  (注明机构+姓名)
欢迎在Wind中搜索“星火“和”拾穗”多因子系列,下载阅读我们的专题报告。
      本期是该系列报告的第七期,主要讨论如何从纯因子组合的角度看待因子之间的多重共线性关系,通过对简单因子组合和纯因子组合之间的关系进行探讨以期帮助投资者对因子之间的协同关系有更加深刻的认识。
  从纯因子组合的角度看待多重共线性  1        在财通金工“星火”多因子专题(三)《Barra模型深化:纯因子组合构建》中,我们讨论了纯因子组合在实际投资中的意义及其构建方法,我们认为随着国内市场的逐步完善,量化产品在未来将更多地偏向于工具化、指数化发展。对于投资者而言,当需要根据个人观点对国家、行业或者风格进行配置时,这种正交的、纯粹的纯因子组合产品将会大显威力。作为“星火”系列的衍生报告,本期我们仍然从纯因子组合(Pure Factor Portfolio)的构建出发,探讨其与简单因子组合(Simple Factor Portfolio)之间的关系,并讨论如何从纯因子组合的角度看待因子之间的多重共线性问题。
        在实际研究中,因子的收益率往往需要落实在组合的收益率上。当我们构建了一个因子之后,通常有多种不同的方法对因子的有效性进行评价,主要方法包括:
        (1) 分组法:将全市场所有股票根据因子的大小进行分组,根据因子对收益率的影响方向对第一组和最后一组构建多空组合,观察多空组合的收益情况;
        (2) Fama-French方法:将全市场所有股票按照其市值分为S和B两组,再根据目标因子的大小按照前30%、中间40%和后30%的关系分别构建三个组合(记为H、N、L),由此因子收益可以通过如下几个组合的收益之差计算得到:


其中,每组收益可以采用等权或者市值加权求得;
        (3) 简单因子组合:将全市场股票收益对股票因子值进行回归,将回归得到的系数视为因子收益,它衡量的是组合每增加一个单位因子的暴露对组合收益的影响情况
        (4) 纯因子组合:是指将所有可能的因子纳入到回归中,将回归得到的系数作为纯因子收益。纯因子组合对于目标因子存在单位暴露,对于其他因子则不存在暴露。它衡量的是在剔除其他因子的影响之后,每增加一个单位的目标因子暴露能够给组合带来的风险溢价
        由以上分析可知,分组法和Fama-French的方法均是通过人为地对股票进行分组来构建投资组合,然而如何对分位点进行选择通常是一件比较主观的事情。基于此,我们在本文的讨论中主要对简单因子组合及纯因子组合进行介绍,关于分组法和Fama-French方法对单因子的回测,财通金工将在后续的“星火”专题中进行介绍,欢迎投资者持续关注。


1.1 简单风格因子组合
        与纯因子组合不同,简单因子组合的收益是根据一元线性回归拟合得到的。以简单风格因子组合为例,在某个截面期上,将全市场所有股票的收益对单个风格因子进行如下回归:


        其中r_n表示股票n的收益率,X_ns为股票n在风格因子s上的暴露大小,f_c^S、f_s^S和u_c^S分别为截距项因子收益、风格因子收益和特质收益。由于股票收益通常存在异方差性(即小市值股票的特质波动率会明显地高于大市值股票的特质波动),因此我们采用加权最小二乘方法(WLS)来主动减少这些特质波动较大的股票在回归中的权重。在实际应用中,通常采用市值的平方根加权作为回归权重v_n,当然这并不是唯一的赋权方法,其他能够达到类似效果的权重选择我们认为都是合意的。
        在进行模型拟合之前,我们还需对风格因子进行标准化处理。在财通金工纯因子组合的专题报告中,我们通常使得全市场股票因子的市值加权平均等于0,然而在对简单因子组合进行求解时,我们不做这样的处理,而是转而使股票因子的回归权重加权等于0,用公式表示即为:


        其中v_n表示股票n的回归权重。这样处理的好处在于,风格因子与截距项因子(市场因子)之间不存在共线性问题。同样的,在对风格因子的标准差进行归一化时,传统的做法是除以因子的普通标准差即可,但在此处我们使得因子的回归加权标准差等于1,用公式表示即为:


        在对因子值进行了标准化,并对股票的拟合方式进行了设定后,我们即可对模型进行求解。由于风格因子与截距项因子不存在共线性,我们可以直接采用最小加权二乘的解析解对上式进行求解。首先我们计算如下矩阵:


        上述最后一个等式之所以成立,是因为回归权重的总和等于1,标准化后的风格因子回归权重加权等于0,且其回归权重加权标准差等于1。由此,即可推导出截距项因子和风格因子的收益表达式:


        将上述求解的矩阵形式拆解为向量形式,即可得到截距项因子和风格因子的收益表达式:


        可以看到,对于某个风格因子s而言,其简单因子组合中股票n的权重为v_n X_ns。根据我们之前对风格因子的标准化处理方法可知,该组合的所有股票权重总和等于0,也就是说它是一个零额投资组合(dollar-neutral)。进一步分析可知,该简单因子组合对风格因子的暴露度为1,这是由因子的回归加权波动等于1而决定的。
        对于截距项因子(简单市场因子)组合而言,它实际上是全市场所有股票收益的回归权重加权。因此,如果我们采用的回归权重是股票的市值权重,那么简单市场因子即为全市场股票的市值加权平均,即通常所说的指数收益。
1.2 简单行业因子组合
        在上一小节中我们讨论了简单风格因子组合的构建方法,本节我们探讨简单行业因子组合的构建,其主要模型如下:


        其中,X_ni代表股票n在行业因子i上的暴露值,我们采用0-1变量表示。由于每只股票属于且只属于一个行业,因此截距项因子与行业因子之间存在完全共线性,我们必须为其增加一个约束条件才能求得唯一解。常用的做法是使得单个行业因子收益的市值加权平均等于0,即:


        其中W_i表示行业i的市值权重,所有行业的市值权重加总等于1。
        对以上公式进行求解,有:


        其中,V_i表示行业i中所有股票的回归权重之和,W_i表示行业i中所有股票的市值权重之和。由此可,对于简单行业因子组合中的市场因子组合f_c^S而言,它是一个纯多头组合,且该组合中的成分股权重之和等于1,它对于每个行业是市值加权的,但是对于行业内部的成分股则采用的是回归权重加权。对于简单行业因子组合f_i^S而言,它可以通过做多单个行业成分股中回归权重加权组合、同时做空市场因子组合得到。
1.3 纯因子组合
        在财通金工多因子体系中,我们将全市场股票收益拆解到市场收益、行业收益、风格收益和特质收益四个部分:


      其中,X_ni表示股票n在行业因子i上的暴露度,X_ns表示股票n在风格因子s上的暴露度。由于截距项因子与行业因子之间存在完全共线性,我们需加入行业因子收益的市值加权均值等于0的约束条件,以使得方程有唯一解:


      同样的,由于异方差性的存在,我们采用加权最小二乘法对上式进行求解,单个股票的权重即为其自由流通市值的平方根权重。特别需要注意的是,此处对于风格因子的标准化与简单因子组合中的因子标准化不同。在对纯因子组合进行构建的时候,我们使得因子的市值加权平均等于0,而非回归加权平均等于0。这样做的一个好处在于,对于截距项因子而言,其回归所得的收益即为市场指数的收益,这一点在“星火”系列的第一篇专题中有详细介绍。
        在对模型的构建及因子预处理方法进行介绍后,我们就可以开始对模型进行拟合了。在财通金工“拾穗”系列(一)《带约束的加权最小二乘:一种解析解法》中,我们介绍了一种解析解法直接对各纯因子的收益进行求解:


        其中,V表示回归权重矩阵,r表示样本股票的收益,X为股票因子暴露矩阵,S为线性变换向量。由此,每个纯因子组合的权重矩阵Ω^P可以表示为:


        上述矩阵的每一行代表每一个纯因子组合的权重向量。
1.4 实证检验
        到目前为止,我们对简单风格因子组合、简单行业因子组合及纯因子组合的概念及其计算方法进行了介绍。本小节我们从实证角度出发,观察简单因子组合和纯因子组合在回测区间内的净值走势,其中各类风格因子的计算方法如附录2所示。
        财通金工以2009.12.31-2019.2.28为回测区间,以Wind全A为样本,对全市场股票收益进行月度回归,图2和图3分别展示了Beta因子和换手率因子的简单因子组合和纯因子组合的走势。可以看到,对于这两类因子组合而言,简单因子组合和纯因子组合的走势存在较为明显的区别。对于简单Beta因子组合而言,其样本回测区间累计收益为负,说明A股市场存在低Beta效应。然而在剔除了其他因子的影响之后,Beta因子的走势有较为明显的增强。同样的,对于换手率因子而言,剔除了其他已知风格因子影响的换手率因子收益更为稳定,这主要是由于换手率因子和波动率等因子存在非常明显的相关性,而波动率等因子在A股市场上又属于强有效的因子而导致的。


        事实上,并非所有风格因子组合的纯因子和简单因子收益都会存在非常明显的区别,图4和图5分别绘制了规模因子和价值(BP)因子的纯因子组合及简单因子组合的净值走势,可以看到对于这两类因子而言,两种组合的走势还是较为贴合的。究其原因,财通金工认为是这两类因子与其他因子的相关性较弱造成的。(注意,在因子计算时,波动率因子已经对Beta和市值进行了正交化,换手率因子也对市值进行了正交化,因此尽管原始的波动率因子和换手率因子都和市值因子存在强相关关系,但经过正交化处理之后的因子与市值因子的相关性大大减弱了)。


1.5  多重共线性
        由上一小节可知,对于不同的风格因子而言,其简单因子组合和纯因子组合的净值走势会出现不同的分化。有些因子的走势较为贴近,有些因子的走势则相差较大,这样的区别究竟是由于什么原因导致的呢?财通金工将在本小节从简单因子组合和纯因子组合的概念出发,为因子之间的共线性问题提供一定的思考
        提起多重共线性的检验,就不得不提方差膨胀系数(VIF值)。VIF值主要用于衡量自变量之间的多重共线性,它是通过将目标因子对其他因子进行横截面回归并根据回归模型的R^2计算得到:


      图6展示了回测区间,行业因子和风格因子的VIF平均值,一般我们认为VIF值小于3即说明该因子与其他因子之间不存在严重的完全共线性关系。由图中可以看到,所有因子的VIF值都小于3,说明在我们的多因子模型中完全共线性的影响并不十分严重。在所有的因子中,残差波动因子和换手率因子的VIF值相对较高。


        前面提到,简单因子组合是不存在完全共线性的,而纯因子组合是剥离了其他已知因子的影响得到的组合,因此因子与因子之间的共线性问题,即可通过纯因子组合的权重与简单因子组合的权重对比来观察
        Menchero(2010)提出采用因子权重相关系数(Factor Weight Correlation)来衡量目标因子与其他因子之间的共线性,它表示的是简单因子组合和纯因子组合在横截面上的相关系数。具体来讲,假设Ω_nk^P表示纯因子组合k中股票n的权重,Ω_nk^s表示简单因子组合k中股票n的权重,那么FWC系数可以通过如下方法计算得到:


        由于纯因子组合和简单因子组合都是零额投资的,因此这些组合的权重均值等于0,FWC实际上就是两个组合权重的相关系数。


        图7绘制了回测区间段内,29个中信一级行业因子和10个风格因子在横截面上的因子权重相关系数平均值,可以看到所有行业因子的权重相关系数都在0.85以上,绝大部分超过了0.9,说明行业因子与其他已知因子的共线性程度并不强。而对于风格因子而言,这一相关系数就大大减弱了。这主要是由于部分风格因子本身与其他风格因子甚至是行业因子之间也存在明显的共线性。
        Menchero(2010)还提出了另外一项指标因子收益相关系数(Factor Return Correlation),即通过计算因子收益的相关性来观察因子之间的共线性程度。FRC系数是通过计算简单因子组合的收益和纯因子组合的收益在时间序列上的相关系数得到:


        直观上来讲,如果单个因子与其他因子之间的共线性程度很低,那么其他因子的加入并不会对该因子的收益产生明显的影响,该因子的简单因子组合收益和纯因子组合收益将会存在一致性,即上一小节所说的分化程度较小。
        图8展示了行业因子和风格因子在回测区间内的FRC系数,可以看到对于大部分行业而言,该系数能够保持在0.8以上,但是对于部分行业因子(如银行业)和部分风格因子(换手率因子),该系数就十分低了。


        Menchero(2010)提出的第三个衡量共线性的指标是因子杠杆率(Factor Leverage Ratio),它被定义为纯因子组合与简单因子组合的成分股权重杠杆率:


        直观上来讲,如果因子杠杆率大于1,说明为了对冲掉其他因子对目标因子带来的风险暴露,目标因子的纯因子组合必须要在某些成分股上进行额外的做多或者做空操作,因此因子杠杆率的比值越大,说明目标因子与其他因子之间的共线性程度越高。


       图9绘制了回测期间所有行业因子和风格因子的因子杠杆率平均值,可以看到绝大多数的因子杠杆率小于1.3,说明仅存在较微弱的共线性问题。而银行业因子和波动率因子的杠杆率分别达到1.92和1.66,处于一个相对高位,这也再次验证了这两个因子与其他因子之间存在较强的相关性。

1.6 小结
        作为财通金工“星火”系列的衍生报告,本文主要从纯因子组合的构建出发,探讨其与简单因子组合之间的关系,并讨论如何从纯因子组合的角度看待因子之间的多重共线性问题,主要结论如下:
(1)对因子有效性的评价通常有分组法、Fama-Macbeth方法、简单因子组合法和纯因子组合法等;
(2)简单因子组合衡量的是组合每增加一个单位因子的暴露对组合收益的影响情况;纯因子组合衡量的是在剔除其他因子的影响之后,每增加一个单位的目标因子暴露能够给组合带来的风险溢价;
(3)在财通金工多因子模型中,因子之间的VIF系数均小于3,说明多重共线性的问题并不严重。但从因子权重系数FWC、因子收益相关系数FRC和因子杠杆率LEV来看,部分行业和风格因子与其他因子仍然存在较为明显的相关性。

(后续章节具体内容可参见报告PDF版本)
风险提示  5本报告统计结果基于历史数据,未来市场可能发生重大变化。

报告原文地址及相关报告
原始报告:
证券研究报告:“拾穗”多因子系列(七):《从纯因子组合的角度看待多重共线性》
发布时间:2019年4月1日
分析师:陶勤英  SAC证书编号:S0160517100002
联系人:张宇 17621688421

下载地址:
链接:https://dwz.cn/ruXAFVKE   提取码:o5zc   

“星火”系列专题报告:
“星火”多因子系列(一):Barra模型初探:A股市场风格解析
“星火”多因子系列(二):Barra模型进阶:多因子模型风险预测
“星火”多因子系列(三):Barra模型深化:纯因子组合构建
“拾穗”系列专题报告:
“拾穗”多因子系列(一):带约束的加权最小二乘拟合:一种解析解法
“拾穗”多因子系列(二):你看到的不一定是你所想的:解密R方
“拾穗”多因子系列(三):行业因子选择:中信一级还是申万一级?
“拾穗”多因子系列(四):总市值、流通市值、自由流通市值:谈谈取舍
“拾穗”多因子系列(五):数据异常值处理:比较与实践
“拾穗”多因子系列(六):因子缺失值处理:数以多为贵

法律声明

根据《证券期货投资者适当性管理办法》(2017年7月1日正式实施),本订阅号发布的观点和信息仅供财通证券专业投资者参考,完整的投资观点应以财通证券研究所发布的完整报告为准。若您并非专业投资者,请勿订阅或转载本订阅号中的信息。若您并非财通证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号中的任何信息。
本订阅号旨在沟通研究信息,分享研究成果,所推送信息为“投资参考信息”,而非具体的“投资决策服务”。本订阅号推送信息仅限完整报告发布当日有效,发布日后推送信息受限于相关因素的更新而不再准确或失效的,本订阅号不承担更新推送信息或另行通知义务,后续更新信息请以有关正式公开发布报告为准。
市场有风险,投资需谨慎。在任何情况下,本订阅号中的信息所表述的意见并不构成对任何人的投资建议,订阅人不应单独依靠本订阅号中的信息而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。本资料接受者应当仔细阅读所附各项声明、信息披露事项及相关风险提示,充分理解报告所含的关键假设条件,并准确理解投资评级含义。在任何情况下,信息发布人不对任何人因使用本订阅号发布的任何内容所引致的任何损失负任何责任。

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:1505
帖子:303
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP