“星火”多因子系列（五）：源于动量，超越动量：特质动量因子全解析

投资要点
  财通金工多因子风险模型研究框架
      一个完善的多因子风险系统通常包含如下三个模块：收益模型、风险模型和绩效归因模型。
      财通金工从数据获取、数据预处理、因子构建及有效性检验、因子深度分析、组合优化、组合评价及绩效归因出发，从无到有、从数据到产品，对多因子研究的流程进行了总结。
      因子有效性检验方法有IC/RankIC法、t检验、简单因子组合法、纯因子组合法、Spanning Test、分组法、GRS检验和Fama-Macbeth检验法等。
  特质动量因子的计算及因子特征
      特质动量因子的构造有直接回归法和三步法两种，其中三步法中又可分为加截距项和不加截距项两种。
      特质动量因子和传统动量因子的原始值与BP因子存在强烈负相关，而与换手率因子、波动率因子和市值因子存在明显的正相关。
  特质动量因子和传统动量因子PK
      经正交化后的特质动量因子和传统动量因子都有一定的选股能力，特质动量因子表现更稳健、分组单调性更好、最大回撤更小。
      特质动量因子和传统动量因子在前期市场上涨时的表现优于前期市场下跌时的表现，且在牛转熊和持续熊市的状态下更为有效。
      当市场由熊市转为牛市时，传统动量因子会出现明显回撤，而特质动量因子的回撤相对较小。
  因子深度分析
      特质动量因子在大市值中的表现仍然较好，并不会出现传统价量因子在大市值成分股中的失效情况。
      特质动量因子多空组合的Beta差值绝对值要明显小于传统动量因子，这是其最大回撤明显更小的主要原因。
      通过Overlapping 组合构建法发现，特质动量因子和传统动量因子在中长期也不会出现明显的反转现象。
风险提示
      本报告统计数据基于历史数据，过去数据不代表未来，市场风格变化可能导致模型失效。
更多交流欢迎联系财通金工张宇，联系方式：17621688421  （请注明机构+姓名）
欢迎在Wind中搜索“星火“和”拾穗”多因子系列，下载阅读我们的专题报告。
市场如战场，收益为攻，风险为盾。在财通金工“星火”和“拾穗”系列的前期报告中，我们花了大量的笔墨介绍如何构建一套稳健的多因子风险系统。从本期开始，我们正式转向投资者们最为关心但同时难度最大的收益端研究。本期我们以对特质动量因子的研究为开篇，正式吹响财通金工在Alpha因子研究领域的嘹亮号角。
            财通金工多因子选股框架综述  11.1 由守转攻：从风险到收益
   对于大多数投资者而言，收益是直接的，风险是潜在的；收益是极具诱惑力的，风险则是经常被忽略的。然而与此同时收益是不稳定的，风险却是可控制的，因此在实际投资中，对收益端的研究往往比对风险端的研究难度更大。财通金工将整个多因子模型的主要研究框架划分为如下四个部分：
      1）收益模型：主要研究如何对股票的收益进行预测。Alpha研究主要从估值理论和投资者行为等不同角度出发，挖掘对股票未来收益有显著影响的因子，并对其有效性及适用性进行检验。在构建完善的单因子库之后，即需考虑如何对因子进行合成和择时；
      2）风险模型：主要研究如何对组合的风险进行控制。Risk研究重点在于如何对股票收益的协方差矩阵进行稳健估计，由于二阶矩比
一阶矩更具稳定性，因此对风险的预测和控制比对收益的预测更为有效；
      3）组合优化：将收益模型和风险模型相结合，研究如何在最大化组合预期收益的同时最小化组合的预期风险。由于实际投资中投资经理还会受到换手率、最大权重、跟踪误差、风格偏离等各种细节层面的约束，因此通常需要从组合优化层面出发，求解满足投资者预期约束的组合权重；
      4）绩效归因：从收益来源和风险暴露两个层面对组合绩效进行综合评价。对投资组合的绩效进行归因，有利于投资者更加了解自己持仓的攻击性和防御性，从而在不同的市场状态切换下操作自如。

      在财通金工“星火”多因子系列的前四篇专题报告中，我们花了大量的笔墨介绍如何构建一套完整的多因子风险系统，其中《Barra模型初探：A股市场风格解析》聚焦风险系统中的收益分解部分，详述因子构建和模型拟合方法，利用多因子模型对A股市场的风格进行解析，并将其应用到对任意给定投资组合的收益分解和风险敞口的计算上，效果显著。《Barra模型进阶：多因子风险预测》主要对风险模型协方差矩阵估计进行探讨，借助多因子模型对股票收益率协方差矩阵进行结构化估计，并将其运用到对任意投资组合的未来风险预测及预期最小风险组合的构建中，可以看到预测效果具有可信性、最小预期风险组合的实际风险也显著更低。《Barra模型深化：纯因子组合构建》更多关注组合优化的部分，借助组合优化的思想，构建A股市场上更具可投资性的纯因子组合，财通金工认为这种单一、正交、纯粹的纯因子组合在量化产品工具化、指数化发展的趋势下将大放异彩。《基于持仓的基金绩效归因：始于Brinson，归于Barra》则聚焦组合的绩效归因，从收益和风险两个层面对组合的收益来源和风格暴露进行分解，为研究者的实际投资提供更为直观的操作指南。

作为“星火”系列报告的第五篇专题，同时也是本系列对于Alpha因子进行探讨的第一篇报告，我们首先对财通金工多因子选股的总体框架进行介绍，随后从因子构建、因子相关性、因子有效性和因子情景分析等不同角度出发，对传统动量因子和特质动量因子在A股市场上的表现进行全景解析，并讨论如何从特质动量因子的角度对传统的动量因子进行改进和优化。
1.2 财通金工多因子选股研究框架介绍
尽管市场上已经有很多优秀的研究报告对多因子选股的研究体系进行了概括，但作为财通金工对Alpha因子进行讨论的开篇报告，我们认为有必要再度对其流程和框架进行一次总览式的介绍。“举一反三”，后续我们的一系列报告都会对其中的主要模块再度涉及。图3从数据获取、数据预处理、因子构建及有效性检验、因子深度分析、组合优化、组合评价及绩效归因等不同步骤出发，从无到有、从数据到产品，对多因子研究的流程进行了总结，本节我们就其中的一些细节部分展开讨论。

1.2.1 数据获取
      数据是研究之本，如果没有优质的数据来源，巧妇也难为无米之炊。目前市场上很多优秀的第三方数据提供商均各具特色，比如Wind数据种类齐全、提取方便、使用人数广，聚源数据质量较优、价格实惠，朝阳永续在一致预期和私募基金数据上独占鳌头，天软科技在高频数据上优势明显，其他的数据提供商还有国泰安、通联、大智慧、东方财富、巨潮资讯、集思录等。值得一提的是，随着量化研究的受众越来越广，很多量化交易平台或接口如tushare、Quandl、vnpy等都能够获取一些免费数据。而随着爬虫技术及文本分析技术的发展，很多非结构化的数据如股吧评论、微博热评、雪球观点、百度搜索等蕴含着市场参与者强烈主观情绪的数据也越来越受到关注。
从数据类型上看，我们可以将数据划分为价量数据、财务数据、文本数据、图形数据等。价量数据在实际交易中最为常见，它们通常是市场参与者交易过后的结果，里面蕴含着丰富的交易信息。价量数据可信度好、更新频率快、覆盖率广、结构化程度高、处理难度小，是非常适合量化研究者分析的数据。财务数据则更多从公司和行业的基本面出发，更加贴近“价值投资”的理念。然而，财务数据在更新频率、数据完整度和数据准确性上往往不及价量数据，而且在实际处理中我们还需特别关注上市公司对财务数据的修正和财务造假等问题。文本数据和图片数据同属非结构化类型的数据，它们在机器学习和语义分析等研究领域不断发展的背景下也颇受关注，如可以对公司新闻的标题进行语义分析了解市场预期，也可以结合K线图和循环神经网络进行择时交易等等。文本数据和图形数据本身十分新颖、涉及研究者较少，但是数据本身所含噪音较大、信噪比低且处理难度相对较高，因此研究难度相对较大。
1.2.2 数据预处理
在从数据源获取了数据之后，下一步即需对数据进行预处理，我们从数据存储和数据清洗两个方面对此进行探讨。
数据存储部分涉及到数据库选择、表结构选择和数据更新方式的选择等。首先是数据库选择，在数据量不大的情况下我们通常可以考虑.mat、.h5、Pickle、Excel或者.txt文件等，但当数据增长到一定程度或需提供定制化服务时，采用数据库对其进行存储就必不可少了。常见的数据库划分有关系型数据库（如MySQL、SQLServer等）、非关系型数据库（NoSQL）和介于二者之间的MongoDB。对于量化研究中的绝大多数数据而言，关系型数据库能够满足需求，但有时为了结构化数据的表结构简便性处理或当数据本身就是非结构化数据时，我们仍需配合MongoDB数据库进行读写操作（如多因子风险模型中协方差矩阵的存储）。
在选择好合适的数据库之后，接下来就需要对数据的框架及具体的表结构进行设计。由于财通金工使用的是聚源的落地数据库，因此我们要做的工作即是从落地数据库中提取数据并将其预处理成合适的表格式。对于大多数数据而言，我们倾向于将一个指标处理成一张T×N的表格，其中T表示交易天数，N表示股票数量，其横坐标为交易日期，纵坐标为股票代码。表1列出了财通金工数据库表结构的主要框架，其中指数和股票的行情数据及估值数据处理起来较为方便，因为它们在数据库中本身就是每日更新的。但指数成分股、所属行业、ST标志和停复牌信息等数据处理起来就相对繁琐，因为它们在数据库中对应的是一张进出流量表——原始数据本身并非是每日更新的。例如在原始数据库中记录的是某只股票在何时进入和退出指数，某只股票在何时被记为ST、何时被摘除ST，某只股票何时划分为行业A、何时划分为行业B等等，对于这样的数据我们也需具体情况具体分析，并将其处理成T×N的表格式，以便后续处理。

在规划好数据表的格式之后，第三个问题即涉及到数据的下载和更新方式，我们采用批量下载和增量更新相结合的方法。由于财通金工的主要数据源来自聚源落地数据库，不像API接口存在流量限制，因此我们通常在第一次数据库搭建的时候采用一次性批量下载的方式进行数据读取并经过数据预处理将其存入到本地。以后在每次更新的时候都只需对新的交易日产生的新数据进行更新，这样不仅更新速度快，也不会改变原有的数据，从而保证数据的一致性和准确性。
另外需要特别注意的是，在处理财务因子的衍生指标（特别是涉及到同比、环比增长率指标）时，由于上市公司经常会对很久以前（比如上一个年报）的财务数据进行修正，因此在计算这些衍生指标时，我们建议每次根据落地数据库中的基础数据（而非我们处理好的财务数据）进行计算，这样能够有效避免未来数据的使用问题。如图4所示，假设我们要计算某个财务因子前5期数据的均值，如果该上市公司在2018年年报里对2017年年报里的数据进行了修正（数据由A_1更新为A_1^'），那么在2018年三季报公布后到2018年年报公布前的交易日内，我们在计算时都只能采用数据A_1，而在2018年年报公布后，计算时才能采用数据A_1^'。我们之所以建议每次根据落地数据库中的底层数据进行计算，是因为存在数据修正情况的数据表本身不再适合只用一张基础表来进行存储，而财务数据的更新频率通常以季度为单位，数据量并不大，因此为了处理上的方便性及结果的准确性，我们建议直接根据底层数据进行计算。

在将基础数据进行规整化处理后，接下来即可着手因子指标的构建。由于现实数据经常存在异常值和缺失值等问题，因此需对数据进行进一步的清洗。财通金工在“拾穗”系列（五）《数据异常值处理：比较与实践》中，详细介绍了异常值处理中常用的均值标准差修正法、固定比率修正法、中位数去极值法、Beat G.Briner方法、因子排序值标准化法、箱型图法和无量纲处理方法的具体步骤，并从定性和定量两个角度对这些方法的优劣进行了比较。在“拾穗”系列（六）《因子缺失值处理：数以多为贵》中，我们介绍了缺失值处理中采用较多的市场均值填充、行业均值填充、市值分组均值填充、前向数据填充和结构化填充等多种方法，感兴趣的投资者可做参考，此处不再过多赘述。

关于数据处理部分我们讨论的最后一个问题是因子的正交化。事实上，在因子选股的研究中，投资者通常希望做到诸如市值中性或是行业中性的要求，也就是说，需要从目标因子中剔除市值因子或是行业因子的影响。为实现这一目的，通常有如下两种方法：
      1）回归法
      回归法的主要步骤是将目标因子对所需剔除的因子进行回归，将回归得到的残差项作为新因子的代理变量。

      如上所示，将待检验的因子X_New作为因变量，待剔除的因子作为自变量进行回归，由于残差项与自变量之间互不相关，因此将残差项作为新因子的代理变量，可以认为已经消除了行业、市值、动量和波动的影响。
      2) 分层法
      分层法通常用于剔除单个因子对目标因子的影响，其主要步骤如下：
   a) 根据待剔除因子（如Size）的大小将样本股票分为10层；
   b) 在每层中再根据待检测因子X_New将股票分为10组；
   c) 每层中的第1组-第10组进行合并，得到新的10个分组。

      回归法操作简单、逻辑直观，但由于自变量因子之间往往存在强相关性，因此有时并不能将其他因子剔除干净，且这种方法只能用于线性剔除，对于因子的非线性特征作用并不明显；分层法中性化的效果更佳，但若有多个待中性化因子，则在分组中会存在股票数量不够等问题，正因如此后者通常被用于剔除单个因子的影响上。此外，正交化的方法通常有对称正交法、规范正交法、施密特正交法等，这些方法是否都适用于因子正交化的范围内，财通金工将在“拾穗”系列的后续报告中予以介绍，欢迎投资者持续关注。
1.2.3 因子有效性检验
寻找对资产定价具有显著影响的单因子是多因子研究中的基础，对单因子的有效性进行检验便是重中之重。目前学术界和业界有多种方法对因子的有效性进行检验，大致可以分为统计法和组合法两大类。基于统计类的方法（如IC、RankIC、t检验、简单因子组合、纯因子组合、Fama-Macbeth回归、Spanning Test等）主要从因子本身出发，观察其是否存在显著溢价；基于组合类的方法则更多落实到组合构建层面，观察投资者在实际操作中是否能够获取稳健的超额收益。

      1） IC、RankIC及t检验
      在单因子测试中，因子的IC值由于其计算方法简单直观，且不受交易细节的影响，是衡量因子有效性的重要指标。本质上而言，它是本期因子值与下期股票收益之间的Pearson相关系数：


      在财通金工“拾穗”系列（二）《你看到的不一定是你所想的：解密R方》中，我们推导了一元回归中的R方与IC平方之间的等同性。然而由于在构建组合时我们更多的是根据因子的相对大小进行分组，因此相较因子的实际取值，我们更关注其相对排序，秩相关系数（或称Spearman相关系数）RankIC因而成为衡量因子有效性更为常用的指标。
      由于因子在每个截面期对于股票收益的影响大小并不稳定，在部分时间段内其可能是十分显著的定价因子，然而在其他时间该因子可能对股票收益的预测作用并不明显，因此我们需要对整个回测区间内的因子显著性进行检验，从而观察该因子在全样本区间内的风险溢价均值是否显著地不等于0。在数理统计中，给定一列服从正态分布的样本数据x，如果要检验该数据的均值x 是否显著地不等于0，最常用的方法是t检验，其计算方法如下：

      其中，x 表示数据的均值，s表示数据的样本标准差，n表示样本数量，x_0表示待检验的值，如果我们需要检验序列的均值是否显著地不等于0，那么可将x_0置为0，可以证明通过如上方法构建的检验统计量t值服从自由度为n-1的t分布。假设数据x服从正态分布x~N(μ,σ^2)，那么其样本均值同样服从正态分布：

      由Cochran定理可知，数据的样本方差与总体方差之间服从如下χ^2分布：

      因此，通过上述方法构建出的t值即可进行如下变换：

      其中，X=(x -x_0)/(σ/√n)服从标准正态分布，Y=((n-1) s^2)/σ^2 服从自由度为n-1的χ^2分布，因此检验统计量t值服从自由度为n-1的t分布，证明完毕。
在构建出每一期的t值之后，我们一般需要将t值的绝对值与2进行比较，如果t值的绝对值大于2，则说明该因子显著。在对因子组合的收益进行显著性检验时，由于每个截面期都有一个t值，因此我们还需计算t值绝对值大于2的次数占比。那么，为什么会选取2作为比较的阈值呢，这实际上是与t分布的95%置信度区间有关。图9和图10展示了在不同自由度下t分布95%置信区间的上下限，可以看到随着自由度逐渐增大（大于30后），置信区间的上下界非常接近-2和2。由于我们在实证研究中的数据个数经常会大于30，因此直接将t检验量的绝对值与2进行比较来判断其显著性即是非常方便的操作。

2）简单因子组合及纯因子组合法
      简单因子组合法和纯因子组合法也能用于因子有效性的检验中，关于其具体概念及求解方法可以参照财通金工“拾穗”系列（七）《从纯因子组合的角度看待多重共线性》，二者之间的主要区别在于是否考虑其他因子对于目标因子的影响。简单因子组合的收益是根据一元线性回归拟合得到的，具体来讲在某个截面期上，将全市场所有股票的下期收益对本期目标因子暴露度进行横截面回归：

      其中，r_n表示股票n在下期的收益率，X_ns为股票n在本期目标因子s上的暴露度，f_c^S、f_s^S和u_c^S分别为截距项因子收益、目标因子收益和特质收益。简单因子组合收益衡量的是当期因子每增加1个单位，股票收益所需要的风险补偿。
      纯因子组合模型中则纳入了更多的风格因子作为解释变量，将全市场股票收益拆解到市场收益、行业收益、风格收益和特质收益四个部分：

      其中，X_ni表示股票n在行业因子i上的暴露度，X_ns表示股票n在风格因子s上的暴露度。由于截距项因子与行业因子之间存在完全共线性，我们需加入行业因子收益的市值加权均值等于0的约束条件，以使得方程有唯一解：

      与简单因子组合收益不同，纯因子组合收益衡量的是在剔除了其他风格因子和行业因子的影响之后，每增加1个单位的目标因子所带来的风险溢价。
      无论是简单因子组合还是纯因子组合法，在根据横截面回归求解出目标因子的每期收益后，通常都有两种方法对其显著性进行检验：其一，通过计算每期回归中目标因子t值绝对值的平均，以及t值绝对值大于2的比例来判断该因子是否是一个有效的定价因子；其二，对每期回归得到的目标因子收益按照前面提到的方法进行t检验，观察t值是否显著。
   3） Spanning Test
      Spanning Test实质上是一个时间序列上的回归，它以Fama-French三因子的计算方法为基础，通过将目标因子的模拟组合收益（Factor Mimicking Portfolio）对MKT、SMB、HML因子进行时间序列回归，观察回归的截距项是否显著地不等于0从而判断在剔除了FF3因子或FF5因子之后该因子的定价能力。下面，我们以Fama-French三因子版本为例进行说明：
      在每个截面期上将所有股票按照市值大小分为S（市值最小50%）和B（市值最大50%）两组，按照账面市值比分为L（BP最小30%）、N（BP介于30%-70%）和H（BP最大30%）三组，随后进行两两组合并计算每组股票在下一期收益的市值加权平均。由此，市值因子SMB（Small-Minus-Big）和账面市值比因子HML（High-Minus-Low）的收益即可通过如下方法计算得到：

      同样的，假如我们的目标因子为动量因子，我们将动量因子由小到大排序分为L（动量最小30%）、N（动量介于30%-70%）和W（动量最大30%），那么动量因子的因子模拟组合收益WML（Winner-Minus-Loser）即为

可以看到该因子的计算框架与HML因子的计算完全一样，因此在函数编写的过程中我们可以考虑将其整合为一个类，传入不同的因子值即可返回不同的因子模拟组合收益。
最后我们将WML因子收益对MKT、SMB和HML因子收益进行时间序列回归，观察截距项的显著性。如果截距项是显著的，那么说明Fama-French三因子无法解释目标因子异象，因此有理由该因子是一个显著的定价因子：

      4) 分组法
      到目前为止，简单因子组合和纯因子组合均是通过横截面回归的方法来判断目标因子对股票下期收益的影响情况，其衡量的是因子在统计意义上的显著度，于实际投资层面来讲并不十分直观。分组法通过对因子值进行排序分组构建投资组合，并观察各组累计收益是否存在明显的分化，是一种更加贴近实际投资的因子检验方法。
      具体来讲，在每个调仓日（通常为每个月月末）根据目标因子从小到大分为K组（一般取K=10），通过等权或者市值加权构建K个组合，并计算这K个组合在下一个月的超额收益，最终形成一个T×K的收益率矩阵。一方面我们关注这K个组合在回测区间内的累计收益是否存在良好的单调性，另一方面我们通过做多第一组、做空最后一组构建一个零额投资的多空对冲组合，观察该对冲组合的累计收益是否稳定。
       5) GRS检验
      GRS检验最早由Gibbons, Ross和Shanken于1989年提出，用于检验十分组情况下各组的超额收益Alpha是否联合不等于0。其具体步骤如下：
      a) 分组：在每月月末的最后一个交易日根据目标因子由小到大进行排序分为10组，计算每组股票在下一个月的市值加权平均收益，从而形成一个T×N收益矩阵（T表示交易月数，N表示分组数量）；
      b) 回归：将每个组合的月度收益序列对已知因子的收益率序列（如MKT、SMB、HML等因子）进行带有截距项的时间序列回归（若有N个组合，则进行N次回归）：

      随后可将上述回归得到的每组超额收益α _i（标量）和残差收益向量ε _i（T×1向量）进行拼接，形成超额收益向量α （N×1向量）和残差收益矩阵e （T×N矩阵）；
      c)检验：在经过时间序列回归得到各组的超额收益和残差收益之后，接下来即可对各组的超额收益是否显著地不等于0进行检验。如果某个因子是有效的定价因子，那么该因子的分组收益不能被已知因子完全解释，即将各组收益对已知因子进行时间序列回归后得到的截距项α_i联合起来不等于0。由此，原假设可以表示如下：

   假如残差收益独立同分布且服从正态分布，那么即可构建如下检验统计量：

      其中，T表示交易月数量，N表示组别数量，K表示时间序列回归中纳入模型的自变量因子数量，α 为各组经过时间序列回归得到的截距项向量（N×1），f 表示时间序列回归中自变量因子的历史收益均值（K×1）：

      其中，f _k表示第k个因子收益的均值（标量）。Σ 为各组收益进行时间序列回归后残差向量ε_i的协方差矩阵（N×N），其计算方法如下：

      其中，e 为经过时间序列回归得到的残差收益矩阵（T×N），由OLS回归的性质可知，Σ 是残差向量协方差的无偏估计量。此外，Ω 是回归模型中自变量因子的协方差矩阵（K×K），其计算方法如下：

      其中，Ω 是样本协方差矩阵，它是总体协方差矩阵的无偏估计量。Gibbons，Ross和Shanken（1989）证明该检验统计量服从自由度为（N，T-N-K）的F分布，因此我们可以通过计算上述GRS检验统计量结合F分布的性质，来判断是否接受或者拒绝原假设。若GRS检验统计量很大（如超过95%置信区间），则需要拒绝原假设，也即说明该因子是一个有效的定价因子。
      需要说明的是，目前为止我们都认为回归残差之间不存在自相关和异方差性，如果这一条件不满足，我们估计得到的残差协方差矩阵就不再是无偏和一致的，因此需要用Newey-West或者GMM方法进行调整，此处不做过多展开。
   6) Fama-Macbeth检验
      在前面提到的Spanning Test和GRS检验中，我们均是将组合的月度收益率对已知因子的月度收益率进行时间序列回归，观察截距项的显著性，而在Fama和Macbeth（1993）提出的Fama-Macbeth回归法中，则是通过结合时间序列回归和横截面回归，采用如下的两步回归法来对因子有效性进行检验的。
具体来讲：
a) 时间序列回归：在某个月月末，将每一只股票的历史收益率对已知因子的收益率进行时间序列回归，计算得到相应的回归系数

      在上面的回归中，自变量因子既可以是已知因子的收益（如SMB、MKT、HML等），也可以是一些宏观经济指标（如CPI、M2、GDP等），但我们认为在对每只股票进行时间序列回归时，这些自变量的取值需要保持一致，因为回归的目的是要得到不同的股票在这些因子上的暴露程度。也就是说，如果想要衡量市值、BP等因子对股票收益的影响，我们回归时并不是将股票收益对市值因子本身和BP因子本身进行回归，而是将股票收益对SMB和HML的收益序列进行回归。这是因为每只股票的市值因子和BP因子都是不相同的，如果直接将个股收益对因子值本身进行时间序列回归，将得到的回归系数被认为是该因子的预期收益的话，那么对于不同股票进行回归得到因子的预期收益却并不相同，这一点与我们的预想并不一致，因为这种情况下股票所暴露的因子值和因子的收益都不相同，无法进行比较。相较之下，由于每个时期所有股票所暴露的宏观环境是一致的，因此可以直接将宏观指标的因子值本身作为回归变量，这样回归得到的系数就代表了每只股票对宏观经济指标变化的敏感性。
b) 横截面回归：在经过时间序列回归得到每只股票在单个因子上的暴露度之后，接下来就是进行横截面回归，观察不同的因子暴露度对股票收益的影响，这一点与前面提到的纯因子组合法十分类似。具体来讲：

      此处回归中的自变量因子为上一步回归得到的因子系数。对于每一个截面期t时刻我们都可以得到一个因子溢价向量(β_(t,1),β_(t,2),…,β_(t,k) )（1×K向量），那么假设共有T个时期，即可得到一个T×K维的因子溢价矩阵。
c)均值检验：对于单个因子而言，在得到其因子溢价的时间序列后，接下来的工作就是对其显著性进行检验了。假设数据服从正态分布，我们即可采用前面提到的t检验对因子溢价的显著性进行检验。
      由以上分析可知，Fama-Macbeth回归法与纯因子组合分析法的概念十分类似，所不同的是FM回归中因子的暴露度先根据时间序列上进行回归所求得的，而对于纯因子组合分析法中，股票在单个因子上的暴露度就是因子本身经过标准化处理所得到的。
      到目前为止，我们详细介绍了因子有效性检验的几种方法，其中t检验是所有检验中的基础，IC和RankIC是衡量因子有效性非常直观的指标，简单因子组合和纯因子组合与Barra模型中的回归方式一脉相承，是业界采用的比较多的方法；Spanning Test则以Fama-French因子的构建为基础，从时间序列回归的角度观察组合是否存在超额收益；分组法通过将因子进行排序分组构建投资组合，对投资者的实际操作更具指导意义；GRS检验在分组的基础上，通过时间序列回归观察所有组别的超额收益是否联合不等于0；Fama-Macbeth检验则将时间序列回归和横截面回归联系起来，是学术界采用比较多的因子检验方法。总体而言，这些方法都没有明显的优劣，投资者在实际研究中都可进行尝试。
1.2.4 因子深度分析
      为了对因子的适用性有进一步的理解，我们还需关注一些其他指标，典型的如因子覆盖率、因子相关性和因子稳定性等。
1)    因子覆盖率
      首先我们需要关心因子在每个截面期上的覆盖率情况，较高的覆盖率使得可供选股的范围较大，通常来讲价量因子的覆盖率较优，财务因子和一些特色因子（如专利因子、公司治理因子）的覆盖率相对较窄。
2) 因子相关性
为了避免目标因子与已知Alpha因子之间存在完全共线性，我们需要了解目标因子与已知因子之间的相关情况。通常有两种方法对因子之间的相关性进行检验，第一种方法通过构造相关强度指标〖RSI〗_AB，对各因子之间的相关系数进行检验，该指标计算方法如下：

      其中，〖Corr〗_t^AB是指在t期所有股票的A、B因子之间的相关系数，〖RSI〗_AB指标实际上衡量的是因子相关系数的稳定性。需要注意的是，为了避免极端异常值对相关系数的影响，此处我们建议对因子进行标准化后再计算相关系数，或者在指标构建时采用因子的秩相关系数作为代替。
      因子相关性检验的第二种方法是分组法，首先在每个截面期根据目标因子从小到大分成10组，随后计算每组股票在其他已知因子上的加权平均，最终计算每个组合在回测区间内的均值，观察10个组合在已知因子上的暴露度是否存在单调性。同样的，为了避免因子值的较大变化所带来的影响或者为了方便不同的因子之间可以进行比较，我们也可采用打分法或对因子预先进行标准化处理。具体来讲，可分为如下几种方式：
      a) 在每个截面期上，直接计算每个组别在原始因子上的加权平均，随后计算每个组别在时间序列上的均值；
      b) 在每个截面期上，先将所有股票的因子值进行标准化，随后计算每个组别在标准化后因子上的加权平均，最后计算各组时间序列均值；
      c) 在每个截面期上，先将因子值转换成排序值，随后计算每组在排序值上的加权平均，再根据加权平均打分，最后计算各组得分时间序列均值；
      如果各个组别在其他已知因子上的排序存在明显的单调性，则说明目标因子与其他因子之间存在强相关性，我们需要考虑对其进行正交化处理，从而剔除已知因子的影响。
3)   因子稳定性
  因子的稳定性也是我们关注的重要指标，如果因子在相邻两期中的变化十分剧烈，那么根据该因子构造的组合换手率将会非常高，这将为因子的实际应用造成较大的困扰。我们采用自稳定相关系数ρ_kt对因子稳定性进行衡量，其计算方法如下：

      其中，X_nk^t是指t时期股票n在因子k上的取值，可以看到ρ_kt实质上是相邻两个截面日期上股票因子值的相关系数。
4) 情景分析
对不同样本指数和不同市场状态下的因子有效性进行情景分析则是加深因子理解的另一途径。在前面的介绍中我们通常是对全样本股票进行回测，然而不同因子可能呈现出不同的市值特征和行业特征，因此对因子的市值衰减和行业衰减进行分析即能够帮助我们更加了解因子在不同成分股中选股的有效性。
      对于因子的市值衰减，一般可以将全市场股票按照其市值由小到大分为10组，分别测试每个市值分组下目标因子的有效性（一般观察RankIC、胜率等）。而对于行业因子而言，我们一般采用中信一级的29个行业进行回测。需要注意的是，由于部分行业包含的样本股较少（如银行业），如果回测区间选择过长或者分组组别数量过多，将会使得因子在行业内的检验存在失真，因此在进行行业衰减检验时我们一般分为5组。
   因子的时间衰减衡量的是因子对于收益预测的持续能力，在前面的介绍中我们通常持有组合1个月后调仓，然而更一般的，我们想要了解因子要经过多长时间后失效或者在中长期是否会出现反转，可以通过RankIC的时间衰减进行衡量：

      其中，X_t表示t期因子值，表示滞后阶数，r_(t+)表示从当前时刻t到t+期间股票的收益情况。衡量因子时间衰减的另一种方法是Jagadeesh和Titman（1993）提出的Overlapping组合构建法，其示意图如图11所示。

      具体来讲，假设要检验目标因子在未来3个月的持续性，就需要在每期对因子进行排序后分组，观察每个组别在未来3个月的收益情况。为了避免每3个月才换一次仓导致的样本数量过少以及初始日期的选择对回测结果造成的影响，我们在每个月都将因子进行重新分组，并将这样的组别划分持续持有3个月。因此，在回测中T月每个组别中实际上就有3个组合，它们分别是根据T-1月月末、T-2月月末和T-3月月末的因子值进行排序来构建的。为了处理的简便性，我们对3个组合的资金进行平均分配，每个组别内部的个股权重也进行等权处理，由此组合在第三个月的收益即为：

最后，我们关注因子在不同的市场状态下呈现出的不同特征。可以通过情景分析法将市场划分为不同的状态，观察在不同市场风格下目标因子的有效性。具体来讲，以当前时刻往前推一年的Wind全A指数的涨跌幅作为市场涨跌的标志，若涨幅大于0认为市场处于Up状态，若涨幅小于0则认为市场处于Down状态。同样的，我们以Wind全A指数本月的收益方向与前12个月的收益方向作为市场动量还是反转的标志，若二者维持一致则认为处于Momentum状态，否则认为处于Reverse状态。因此，市场可以划分为如下几个不同的状态：
      1) Up：前期市场处于上涨状态；
      2) Down：前期市场处于下跌状态；
      3) UpMomentum：前期市场上涨，且本月继续上涨
      4) UpReverse：前期市场上涨，本月反转下跌
      5) DownMomentum：前期市场下跌，本月市场继续下跌
      6) DownReverse：前期市场下跌，本月反转上涨
      在财通金工“拾穗”系列（九）《牛市抢跑者：低Beta一定代表低风险吗？》我们对Beta因子进行情景分析发现，尽管该因子并不是一个在全样本时间段内都有效的因子，但是其在持续熊市或牛转熊的市场状态中是一个非常显著的负向因子，而在熊转牛的行情下则是一个非常显著的正向因子。挖掘一个在任何时间段都有效的Alpha因子是十分困难的，对因子在不同市场状态下的有效性进行检验，更有利于投资者结合当前市场行情的主观判断进行配置。
1.2.5 从单因子到多因子
      截止到目前，我们对单因子的有效性和适用性进行了较为完善的分析，研究者们在构建了有效的Alpha因子库之后即需将单因子合成为多因子，继而落实到实际的组合构建方面。从单因子到多因子的飞跃涉及到的细节很多，由于本篇报告仅就单个Alpha因子进行分析，因此对组合优化、组合评价和绩效归因部分我们仅做简要介绍。
      因子合成的第一个问题是对因子权重进行赋权，目前市场上使用的较多的是等权法、ICIR加权法（滚动加权/半衰加权等）、最小波动率合成法等。此外，在实际投资过程中，投资经理还有跟踪误差、换手约束、最大权重、仓位控制等限制，因此需要将这些约束转换成对应的约束条件放入到模型中进行求解，以下是其中的一种优化模式：

      其中，w表示组合权重（N×1向量），w_B表示基准组合权重（N×1向量），w_0表示组合在调仓前的权重（N×1向量），α表示个股期望收益（或因子值），X_S和X_I分别表示股票在风格因子和行业因子上的暴露度（N×K矩阵，K为因子个数），X^lower和X^upper分别代表组合在因子上暴露度的下界和上界，为K×1向量。
可以看到，(w-w_B )^' α表示组合的超额期望收益，〖TE〗^2表示组合的跟踪误差（或主动风险）：

  1^' |w-w_0 |表示组合的换手率，λ_1和λ_2为调配系数，它们调节投资经理在最大化目标收益、最小化跟踪误差以及最小化换手率约束上的偏好。
在确定了组合权重的构建方法之后，即可根据预先设定的参数在历史时间上进行回测，观察组合的绩效表现，常用的评价指标有年化收益、年化波动率、夏普比率、胜率、最大回撤、跟踪误差等。
      最后我们还需对组合的绩效表现进行归因，从而帮助投资者更加了解组合的收益来源和风险暴露。对组合绩效归因的详细步骤可以参考财通金工“星火”系列（四）《基于持仓的基金绩效归因：始于Brinson，归于Barra》，此处我们不做过多赘述。

      特质动量因子计算方法及因子特征  2在上一部分中，我们对财通金工多因子选股的整体框架和单因子检验的具体步骤进行了详细的说明。从本部分开始，我们以特质动量因子为例，开展Alpha因子的研究。本部分主要对特质动量因子的不同计算方式进行说明，从因子覆盖率、因子稳定性及与已知因子的相关性来探究特质动量因子的初步特征。
2.1 特质动量因子计算方法
特质动量因子，又称残差动量因子，是指在剔除了传统的风格因子影响之后，根据个股的特质收益计算得到的特质动量因子。然而就因子具体的计算来讲，不同的文献给出了不同的构造方法：
      1) 直接回归法
      Chang（2018）在对特质动量因子在日本市场的有效性检验研究中，采用的是相对简单的直接回归取残差的方法。具体来讲，假设当前时刻为t月月末的最后一个交易日，对于单只股票而言，我们将其t-35月到t月（共36个月）个股月度收益率对Fama-French三因子进行时间序列回归，有：

      根据上述回归得到的残差变量即可认为是该股票在剔除了已知风格因子影响后的特质收益ε_(i,t)。接下来对股票在t-11到t-1月（共12个月）的特质收益进行处理，得到t月该股票经风险调整后的特质收益——特质动量因子值：

      2) 三步法
      在关于特质动量因子研究的经典文章中，Gutierrez（2007）、Blitz（2011）和Blitz（2018）采用的都是三步法求解。具体来讲，假设当前为t月月末的最后一个交易日，对于单只股票而言，首先将其t-36月到t-1月（共36个月）的月度收益率对Fama-French三因子进行时间序列回归得到股票在MKT、SMB和HML因子上的暴露系数：

      随后，根据上述回归得到的因子暴露系数与t月Fama-French三因子的月度收益相乘，即可得到根据FF3因子模型拟合得到的股票月度收益，将股票在t月的实际收益与该拟合收益相减，即可得到股票在t月的特质收益：

需要特别注意的是，以上两种特质收益的计算在是否需要加入截距项中产生了分歧。Blitz（2011）中特别指出，不加截距项是因为在时间序列回归中截距项α更多地被认为是模型的设定误差，而且在回归中我们采用的是t-36到t-1月的因子收益，而在计算特质动量因子的时候我们仅采用t-12到t-1月的特质收益。也就是说在估计α时采用的数据有大约2/3的数据在计算特质动量因子时不会被使用，因此α更多地反映的是个股在t-36到t-13月之间的异常收益。例如，假如某个股票在t-36到t-13月之间有非常高的正（负）收益，那么将很可能导致该股票的特质动量因子偏低（高），由此特质动量因子不仅反映的是中期的动量效应，还包括了长期的反转效应，所以我们倾向于在计算特质收益时不加入截距项。
      最后，我们对每只股票t-12到t-1个月（共12个月）的特质收益进行标准化，求得其风险调整后的收益，即为我们所构建的特质动量因子IMOM：

      此处，我们将特质收益的年化收益率除以其年化波动率，构建特质动量因子。由于我们采用的过去12期的数据，因此特质收益的年化收益即为各期特质收益的累计收益率，而其年化波动率为特质收益标准差乘以根号12。

关于究竟使用“直接回归法”还是“三步法”来对特质动量因子进行计算，目前并没有一个统一的说法，财通金工试图从因子自稳定系数的角度提供一些思考。由两种方式的计算方法可以看到，直接回归法是将个股收益对FF3因子回归得到残差，再根据近期残差收益来计算特质动量因子。那么，这样的处理可能导致一个问题——在每次滚动回归时所求的残差变量并不相同，因此可能导致这种方法计算出来的特质动量因子稳定性没有那么好。相较之下，通过三步法计算得到的特质动量因子的稳定性就会更好，因为在相邻两个截面期计算因子值时，共用了其中的11个数据，其示意图如图14所示。由图12可以看到，通过三步法计算得到的特质动量因子的稳定性要优于直接回归法。

2.2 计算细节及Fama-French三因子走势
本小节对特质动量因子和Fama-French三因子的计算细节进行说明，选定2005.1.31-2019.4.30为回测区间，选定Wind全A为回测样本股，在每个月月末最后一个交易日的时候，我们先剔除上市时间不超过100天的股票、剔除当日停牌一天的股票、剔除ST或*ST股票。随后按照所选股票的自由流通市值大小分为S和B两组，根据账面市值比BP因子分为L、N和H三组，继而计算每组股票在下一期的流通市值加权平均收益，其具体计算方法参见1.2.3 小节。

      图15展示了财通金工计算得到的Fama-French三因子的净值走势，可以看到在样本回测区间内小市值股票表现要优于大市值股票，低估值股票表现要优于高估值股票，而MKT因子则与Wind全A指数的走势十分相似。

   在特质动量因子的计算中我们还需考虑数据的完整度情况进行一些处理。首先在第一步个股时间序列回归求回归系数时，如果某个月该股票处于长期停牌状态，那么股票在该月的收益就很难与风格因子收益保持一致，因此如果股票在某个月的交易天数少于10天，我们就不将该月数据纳入到回归模型中。此外，在第三步根据特质收益来计算特质动量因子时，如果回望的12个月中少于3个月有数据，那么我们也不计算该股票在当月的特质动量因子值。财通金工采用不加截距项的三步法来计算特质动量因子，其因子覆盖率的时间序列如图16所示，可以看到各期因子覆盖率基本上保持在90%以上，回测区间内因子覆盖率均值达到95%，说明因子的完整性较好，数据质量较高。
      在后续的章节中，我们会将特质动量因子与传统动量因子的有效性进行比较，我们在此介绍一下传统动量因子的计算方法。假设当前处于t月的月末，那么单只股票传统动量因子即是该股票在t-12月到t-1月之间的累计收益：

   实证结果分析  3本部分我们对传统动量因子和特质动量因子的有效性进行检验，我们发现原始因子与市值、换手率、波动率等因子存在强相关性，因此要对因子进行正交化处理。正交化处理过后的因子选股效果明显增强，且特质动量因子的选股效果比传统动量因子更为稳定。
3.1 原始因子有效性检验
      下面我们对传统动量因子和特质动量因子在全样本进行分组测试，回测细节如下：
      回测时间：2005.1.31-2019.4.30
      回测样本：Wind全A样本股
      样本筛选：剔除上市时间少于100天、剔除调仓日停牌一天、剔除ST、*ST、PT等被标为风险预警的股票、剔除调仓日涨停或者跌停的股票
      调仓时间：每月最后一个交易日
      分组方式：按照因子值从小到大分10组（D0-D9），每组成分股进行等权处理，因子值最小的一组（D0）作为空头，因子值最大的一组（D9）作为多头
      基准指数：每期满足条件的样本股收益等权平均

      表2展示了特质动量因子和传统动量因子的IC、RankIC、多头及空头基准指数的超额收益，可以看到在全样本时间段内原始因子的IC和RankIC值的绝对值军小于1，在统计意义上并不显著。
      由上面分析可知，传统动量因子和特质动量因子的原始值在全样本区间内的选股效果并不理想，这可能是由于原始因子本身与其他已知风格因子之间存在强相关性造成的吗？图17和图18对特质动量因子和传统动量因子在Beta、BP、最近21天换手率均值（Tunover21）、最近21天收益率（Ret21）、市值（Size）、最近21天相对市场的超额收益波动率（Vol21）的相关性。

为了避免各期因子值的较大变化对最后计算时间序列均值时造成的影响，也为了方便不同因子之间可以进行比较，我们首先将股票的风格因子值转化成排序值，计算各组成分股在该风格因子上的加权均值，然后再根据每组的加权均值进行打分（1-10分），最终计算每组得分在时间序列上的均值。
由图17可以看到，特质动量因子与BP因子之间存在明显的负相关性，特质动量因子越高的组别BP因子值越小；此外，特质动量因子值最大的D9组别市值明显更大；最为重要的是，特质动量因子与换手率因子和波动率因子之间存在非常明显的正相关性，特质动量因子最大的那一组的波动率和换手率都明显更高，由于A股市场上波动率和换手率是非常明显的反向因子，因此多头组合在波动率、换手率和大市值上的暴露在一定程度上削弱了组合收益。最后我们看一下特质动量因子与反转因子（Ret21）之间的相关性，由于在因子计算的过程中我们剔除了最近1个月的收益，因此二者之间并不存在明显的相关关系。
同样的，由图18可以看到，传统动量因子与BP因子之间也存在较为明显的负相关性，与市值、波动率和换手率之间存在明显的正相关关系，而与Beta因子和反转因子之间的关系并不明显。
由以上分析可知，特质动量因子与传统动量因子在市BP、市值、21天换手率和21天波动率之间均存在明显的相关关系，这种相关关系会在一定程度上削弱多头收益、增强空头收益，因此我们需要对这些因子进行剔除，具体来讲：

      在每个横截面上，我们将目标因子对已知因子进行横截面回归，将回归得到的残差变量作为新因子的代理变量，继而检验经正交化后的因子在全样本区间内的选股效果。
3.2 正交化因子选股有效性检验
表3展示了经过正交之后的特质动量因子和传统动量因子的IC、RankIC、多空相对基准的超额收益及多空收益差，可以看到经过正交化处理后二者的选股能力都明显增强。全样本区间内，特质动量因子的RankIC为3.15%，稍低于传统动量因子的3.28%，二者的t值分别为4.98和4.14，统计意义上显著。此外，特质动量因子多空组合收益差的月度溢价达到0.87%，优于传统动量因子0.72%的溢价程度，且其胜率要明显更高（64% VS 56%）。

图19和图20分别展示了十分组情况下，特质动量因子和传统动量因子相对基准指数的月均超额收益，可以看到特质动量因子的分组单调性更好，其多头组合的月均超额收益为0.30%（胜率56%），空头组合的月均超额收益为-0.61%（胜率33%）。相较之下，传统动量因子的单调性就明显更弱，在传统动量因子最大的那一组甚至出现了一定程度的反转，也就是说对于前期涨幅过高的股票而言，在下一个月落后市场基准指数的概率更大。

   图21和图22分别展示了经过正交化处理后特质动量因子和传统动量因子多空组合的净值走势、月度收益差和绩效统计，可以看到基于特质动量因子构建的多空组合信息比率要明显高于传统动量因子（1.42 VS 1.01），而且该组合的最大回撤也明显更小（16.3% VS 37.2%），从这两个指标来看，基于特质动量因子构建的组合都明显更优。
      关于动量因子的回撤是国外研究中最为关心的部分，Daniel和Moskowitz（2013）对美国市场上的“动量崩溃”（Momentum Crash）效应进行了探讨，在后面的章节中我们将从多空组合对Beta因子上的暴露度出发，对特质动量因子相较传统动量因子的回撤明显更小的原因进行分析。
3.3 情景分析
本部分我们对特质动量因子和传统动量因子在不同市场状态下的多空收益差和因子的RankIC进行分析，观察因子的适用情况。根据1.2.4 小节中提到的方法，我们将市场状态分为上涨市（Up）、下跌市（Down）、持续上涨（UpMomentum）、上涨反转（UpReverse）、持续下跌（DownMomentum）和下跌反转（DownReverse）六种情况。

      表4给出了一些非常有意思的结果，首先对于前期市场上涨和前期市场下跌两种状态中，特质动量因子和传统动量因子都在前期市场上涨的状态下更为有效，体现在多空收益均值和RankIC均值更高。此外，二者在牛市反转(UpReverse)和持续熊市(DownMomentum)情况下都更为有效，而对于熊转牛(DownRevese)的行情下，传统动量因子的RankIC为负，而特质动量因子的RankIC仍然维持为正（尽管其在统计意义上并不显著）。
      在Daniel和Moskowitz（2013）关于美国市场的“动量崩溃”现象进行探讨的研究中提到，当市场前期出现持续下跌（Down）时，前期涨幅更多的那些股票对应的即是Beta因子更低的那些股票，因此多头组合的Beta要显著低于空头组合。假如此时市场出现大幅上涨（Reverse），那么空头组合由于其高Beta属性其表现将会远远超过多头组合，从而导致多空组合收益差出现明显的回撤。
      2019年，A股市场在经历了去年的大幅下跌之后出现了强势反弹，市场正处于DownReverse的状态中。在财通金工“拾穗”系列（九）《牛市抢跑者，低Beta一定低风险吗？》我们提到，Beta因子在今年是一个非常显著的风格因子，高Beta股票指数的表现要明显优于低Beta指数。而对于传统动量因子组合而言，多头组合的Beta值要明显低于空头组合，因此在这样的行情下传统动量因子组合将会出现明显的回撤，如图21和图22所示。相较之下，特质动量因子是由剔除了市场风格影响后的特质收益构建的指标，因此受市场波动的影响要相对更小，这也是特质动量因子的表现要优于传统动量因子的原因。
3.4 市值和行业衰减
本部分我们关注特质动量因子在不同市值分组和不同行业下的选股能力，图23展示了根据流通市值进行十分组划分后，特质动量因子的选股能力，其中D0表示市值最小的分组，D9表示市值最大的分组。可以看到，特质动量因子在不同市值分组下并没有展现出单调特征，究其原因可能是我们在因子构建时已经对市值因子做了正交化处理。特别的，对于市值最大的组别D9来讲，其全样本区间内的RankIC达到3.5%，并没有呈现出传统价量因子在大市值股票中的失效情况，这是该因子值得关注的原因之一。

下面我们关注特质动量因子在沪深300成分股中的选股能力，选定2005.4.29-2019.4.30为回测区间，每期按照因子值大小分为5组，图24展示了多空组合的月度收益及净值走势。在全样本期间，因子的RankIC达到3.98%，t值达到3.88，在统计意义上显著。

在特质动量因子的行业衰减检验中，图25展示了其在不同行业内的RankIC及其胜率，可以看到在全部29个中信一级行业中，共有12个行业的RankIC的t值大于2，这部分行业的RankcIC均值为4.53%，月度胜率均值为63.32%。在全部行业中仅有银行业的RankIC均值为负且并不显著（均值为-1.1%，t值为-0.40），而该因子在农林牧渔行业中最为有效，其全样本区间内RankIC均值达到6.5%。

3.5 Fama-Macbeth回归检验及Spanning Test
本节最后一个部分我们对因子有效性进行Fama-Macbeth回归和Spanning Test，二者的具体计算细节在1.2.3 小节中已有详细说明。此处为了简便处理，我们在进行Fama-Macbeth回归的时候并不通过时间序列回归法来获取股票在因子上的暴露程度，而是直接将股票收益对已知Alpha因子进行横截面回归，得到回归系数，最后计算回归系数的均值及其t值。此处我们进行如下两个回归：

由表5可以看到，在剔除了已知因子影响后，特质动量因子每月溢价均值为0.19%，其t值显著（3.104），而传统动量因子的每月溢价均值仅为0.08%，其t值不显著（0.933）。然而对于模型的解释能力来讲，特质动量因子的加入对模型的解释能力提高了0.45%，而传统动量因子的加入对模型的解释能力提高了将近1%，这也说明传统动量因子更多的是一个风格因子，而非Alpha因子。

表6对特质动量因子和传统动量因子进行Spanning Test，可以看到在剔除Fama-French三因子影响后，特质动量因子仍然存在一定的风险溢价，其超额收益的t值达到4.285，远高于传统动量因子的t值2.633，从这个角度来看特质动量因子也比传统动量因子更为有效。
   因子深入分析  4在前一部分中，我们针对特质动量因子和传统动量因子在全样本、不同市值分组和不同行业分组的样本股中，从IC、RankIC、多空收益、Fama-Macbeth和Spanning Test等不同角度对因子有效性进行了检验，发现相较传统的动量因子而言，特质动量因子的表现更加稳健，回撤更小且在各种市场状态下都不容易发生明显的反转，本小节我们针对其背后的原因进行探讨。
4.1 多空组合Beta暴露对比
在前面的分析中，我们多次提及美国市场的“动量崩溃”效应，具体来讲它是指美国市场动量因子在1932年和2009年动量因子在短短两个月的时间内分别亏损近70%和50%的收益，而这两个时刻无疑都对应着美股市场前期暴跌而在该月暴涨的情况。Daniel和Moskowitz（2013）指出，造成这种现象的最主要原因在于当市场前期暴跌时，根据动量因子分组的多头组合和空头组合的Beta因子值会存在明显的区别，当后市出现报复性的上涨时，多头组合由于其低Beta特性将会大幅落后高Beta空头组合带来的收益，从而导致多空组合的大幅回撤，下面我们就A股市场上的传统动量因子和特质动量因子之间的多空组合在Beta因子上的暴露差值进行分析，其结果如图26所示。

可以看到，当市场前期大幅上涨时，多空组合的Beta差值显著大于0；而一旦市场持续下跌，多空组合的Beta因子差将明显小于0，而且在大多数情况下，除非市场出现大幅且持续的上涨，否则多空组合的Beta因子差值将长期处于0以下。以今年的市场行情为例，经过了2018年的持续下，传统动量因子的多空组合的Beta因子处于-0.3的水平，而特质动量因子多空组合的Beta因子值在-0.1的水平，在今年熊转牛的市场行情下，二者在Beta因子上的负暴露使得组合收益出现了明显回撤。进一步分析我们发现，在全样本区间内，特质动量因子多空组合的Beta因子的绝对值普遍比传统动量因子多空组合的Beta绝对值更低，这说明前者有效地控制了组合风险，从而在市场状态发生转变时能够有效地控制最大回撤。
4.2 Overlapping组合法
      在本文的最后部分，我们观察特质动量因子和传统动量因子的持续性，此处我们根据Jagadeesh和Titman（1993）提出的Overlapping方法构建因子组合，观察二者在中长期中是否会出现反转，其结果如表7所示。

可以看到，当持有1个月的时候，特质动量因子和传统动量因子的对空组合都很显著，前者多空组合的月均收益和t值分别为0.87%和3.73，而后者多空组合的月均收益和t值分别为0.72%和2.48，特质动量因子的效果仍然更为稳健。随着持有期的数量逐步增加，二者在中长期时间段内都没有发生反转，特质动量因子的表现仍然总体优于传统动量因子。
   总结与展望  5       作为财通金工对Alpha因子研究的开篇报告，本文花了较大的篇幅详述了多因子选股过程中的流程及细节，并对单因子有效性的检验步骤进行了详尽的描述。随后，我们以特质动量因子为例，从因子构建、相关性测试、有效性检验和情景分析等不同角度出发，对特质动量因子和传统动量因子之间的优劣进行全方位解析，主要结论如下：
（1）多因子选股流程通常包括数据获取、数据预处理、因子构建及有效性检验、因子深度分析、组合优化、组合评价及绩效归因，其中对因子的有效性检验方法介绍是本文的最大亮点；
（2）因子有效性检验方法有IC/RankIC法、t检验法、简单因子组合法、纯因子组合法、Spanning Test、分组法、GRS检验和Fama-Macbeth检验法等；
（3）特质动量因子和传统动量因子的原始值与BP因子存在负相关，与换手率、波动率和市值因子存在明显正相关，因此需对这些风格进行正交；
（4）经正交化后的特质动量因子和传统动量因子都体现出一定的选股能力，且特质动量因子表现更为稳健、分组单调性更好、最大回撤更小；
（5）特质动量因子和传统动量因子在前期市场上涨时的表现要优于前期市场下的时的表现，且在牛转熊和持续熊市的市场风格下更有效；
（6）当市场由熊市转为牛市时，传统动量因子会出现明显回撤，而特质动量因子的回撤相对较小，这主要是因为特质动量因子多空组合在Beta因子上的绝对暴露都要更小；
（7）通过对因子的时间衰减发现，特质动量因子和传统动量因子在中长期不会出现明显反转，可以考虑长期持有。
   风险提示  6多因子模型拟合均基于历史数据，市场风格的变化将可能导致模型失效。

报告原文地址及相关报告
原始报告：
证券研究报告：“星火”多因子系列（五）：《源于动量，超越动量：特质动量因子全解析》
发布时间：2019年5月21日
分析师：陶勤英  SAC证书编号：S0160517100002
联系人：张宇 17621688421

下载地址：
链接：https://dwz.cn/btX5AETP 提取码：kwg5
欢迎在Wind研报平台中搜索关键字“星火“和”拾穗”，下载阅读专题报告PDF版本

“星火”系列专题报告：
“星火”多因子系列（一）：Barra模型初探：A股市场风格解析
“星火”多因子系列（二）：Barra模型进阶：多因子模型风险预测
“星火”多因子系列（三）：Barra模型深化：纯因子组合构建
“星火”多因子系列（四）：基于持仓的基金业绩归因：始于Brinson，归于Barra
“拾穗”系列专题报告：
“拾穗”多因子系列（一）：带约束的加权最小二乘拟合：一种解析解法
“拾穗”多因子系列（二）：你看到的不一定是你所想的：解密R方
“拾穗”多因子系列（三）：行业因子选择：中信一级还是申万一级？
“拾穗”多因子系列（四）：总市值、流通市值、自由流通市值：谈谈取舍
“拾穗”多因子系列（五）：数据异常值处理：比较与实践
“拾穗”多因子系列（六）：因子缺失值处理：数以多为贵
“拾穗”多因子系列（七）：从纯因子组合的角度看待多重共线性
“拾穗”多因子系列（八）：非线性规模因子：A股市场存在中市值效应吗？
“拾穗”多因子系列（九）：牛市抢跑者：低Beta一定代表低风险吗？
“拾穗”多因子系列（十）：行业的风格偏好：解析纯行业因子组合
“拾穗”多因子系列（十一）：多因子风险预测：从怎么做到为什么
“拾穗”多因子系列——期中总结[url=http://mp.weixin.qq.com/s?__biz=MzI2OTI4ODUzNQ==&mid=2247487443&idx=1&sn=0b8f75cdfc5fcf0c8ee780c1bed7fa0b&chksm=eae3daebdd9453fd5a011d4977834482fba21ae741d8798fab7c8df2e42e882e5c535d384e8f&scene=21#wechat_redirect][/url]

法律声明

根据《证券期货投资者适当性管理办法》（2017年7月1日正式实施），本订阅号发布的观点和信息仅供财通证券专业投资者参考，完整的投资观点应以财通证券研究所发布的完整报告为准。若您并非专业投资者，请勿订阅或转载本订阅号中的信息。若您并非财通证券客户中的专业投资者，为控制投资风险，请取消订阅、接收或使用本订阅号中的任何信息。
本订阅号旨在沟通研究信息，分享研究成果，所推送信息为“投资参考信息”，而非具体的“投资决策服务”。本订阅号推送信息仅限完整报告发布当日有效，发布日后推送信息受限于相关因素的更新而不再准确或失效的，本订阅号不承担更新推送信息或另行通知义务，后续更新信息请以有关正式公开发布报告为准。
市场有风险，投资需谨慎。在任何情况下，本订阅号中的信息所表述的意见并不构成对任何人的投资建议，订阅人不应单独依靠本订阅号中的信息而取代自身独立的判断，应自主做出投资决策并自行承担投资风险。本资料接受者应当仔细阅读所附各项声明、信息披露事项及相关风险提示，充分理解报告所含的关键假设条件，并准确理解投资评级含义。在任何情况下，信息发布人不对任何人因使用本订阅号发布的任何内容所引致的任何损失负任何责任。