重要提示:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施,通过本微信订阅号发布的观点和信息仅供海通证券的专业投资者参考,完整的投资观点应以海通证券研究所发布的完整报告为准。若您并非海通证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号中的任何信息。本订阅号难以设置访问权限,若给您造成不便,敬请谅解。我司不会因为关注、收到或阅读本订阅号推送内容而视相关人员为客户;市场有风险,投资需谨慎。
对高博的夸奖,我受之有愧,也感谢各位坚持到现在。从我自己听报告的经验来说,这一下午高质量、高密度的报告,可以听到最后一场,应该都是真爱。希望接下来的四十分钟,不让大家失望。我今天演讲的题目是基本面因子投资的三点思考。前三场报告听下来,我觉得嘉宾们都把我的思考说得差不多了。今天演讲的整体框架是这样:首先,我简单介绍一下我们公司。然后,提出三点思考:第一点是基本面因子投资需要先验。第二点是基本面因子投资需要方法,最后一点是基本面因子投资需要信仰?这里的信仰后面打了一个问号。对于我,它仍然是一个开放性问题,也是希望和大家探讨的一个问题。到底需不需要信仰,信仰来自什么地方。最后,推荐一些书籍给大家。我们公司主要是做量化投资,成立了大概四年。大家都说,做量化,要有数学背景,要有金融背景,要有计算机背景。我们三个创始人每个人有一方面的背景,捏在一块,看来还是能做量化这件事的。[h1]1基本面因子投资需要先验[/h1][h1]介绍就这么多,开始第一个思考,就是基本面因子投资需要先验。以前美国金融协会主席John Cochrane的一段话作为开场,他说,我们之前认为资本资产定价模型(CAPM)可以解释股票预期收益的差异。那些高beta的股票收益应该高,那些低beta的股票收益应该低。这是我们最初的理解,但是现在呢,我们似乎认为CAPM已经失效,因为我们挖出了成百上千个因子。这里的因子仅限于基本面因子,不谈更高频的量价因子。即使对于基本面因子,学术界已经发表出来的也有四百多个了,再加上其他乱七八糟的,上千应该是没有问题的。也就是说,我们有一千个因子来解释截面上哪些是好股票、哪些是坏股票,哪些股票收益高、哪些股票收益低。这其实是一个挺反讽的事情。[/h1]我们为什么会走到今天这个局面,可以借鉴杜克大学Campbell Harvey教授之前在美国做的一个演讲。从基因的角度谈,我们是倾向于“过拟合”这件事的,这是从生存、从进化论的角度来说的。假设一只羚羊正在草原上吃草,突然听到了“沙沙沙”的声音。这个声音可能是微风吹过草丛或者树木,也可能是一只猎豹要捕食。这时它觉得有事,它怕可能是猎豹,所以就跑了两步。后来发现,这不是猎豹,就是微风吹过,这时它犯了 Type I error,就是False Positive,它认为有猎豹,实际上没有。为此付出的代价是什么呢,无非就是多跑了两步,消耗了一定的能量。但如果它不跑,它认为没事,但最终真的是猎豹来了,那它付出的代价就是被吃掉,这说明它犯Type II error的代价是巨大的。所以,从羚羊的角度,它宁愿多跑两步。那么,这件事套在因子上就是,我们挖出的这个因子,Type I error代表它是假的,但我们相信它并使用了。当然,如果控制好风险、控制好仓位,即使这个因子只是一个“过拟合”的产物,那么它在样本外也不过是一个为零的预期收益。但我们宁愿相信它是一个真的因子,因为如果它是,我们却没有用,那就可能少了一个很有效的收益。所以,从进化的角度来说,人似乎也愿意犯Type I error。在实践中,多重检验让我们更容易犯这样的错误。Dr. Marcos Lopez de Prado,True PositiveTechnologies的CIO说:“对同一段历史数据,我们在回测中尝试大量参数或是测试了大量策略后,找出来效果最好的一组参数或者一个策略总能获得不错的效果,但这只是pure luck。”比如,我试了20个因子,找到20个因子里表现最好的。我接着试了50个,找到其中最好的,那肯定比前面20个因子里最好的还要好。我们可以再接着试100个因子,不断地试,那效果肯定越来越好。而这些都是基本面因子,通过不同的加减乘除方式构建的基本面因子。那怎么量化上面这种现象,刚才挖因子的过程归根结底能用两个误差来总结——过拟合偏误(overfitting bias)和选择偏误(selection bias)。我举三个例子:一是假设我试了n个因子,得到平均收益t值的正负号。我不考虑先验,不考虑基本面原理,使用所有因子。如果 t 值大于零就正着用,小于零就反着用,这就是过拟合偏误。二是我试了n个因子,选一个最好的,t值的绝对值最大的,这就是选择偏误。第三个就是更多人经常实践的,试了n个因子,挑出k个最好的,那么这两个偏误就都犯了。通过一个简单的例子就可以看到,犯了这两个偏误可以达到什么样的效果。这是我拿中证500成分股做的实验,因子都是随机产生的,即,每期选股的时候都用随机数。这张图的横坐标n是实验的因子个数,不同颜色的线条对应选择的因子个数。假如我试了十个因子,然后选一个最好的,那么能达到的t值,最高的也能接近3。
当然,用纯随机来模拟过拟合的效果,通常都是高估的。因为用纯随机来挖掘因子,是可以保证因子之间是相互独立的。然而,在真实挖因子的过程中,大量因子通常是有相关性的。这个方法虽然高估了过拟合的程度,但也说明过拟合这个问题必须重视。而且,随着这三条线往上看,选的因子越多,过拟合程度也是单调上升的。这张图是换了一个角度看这个问题。横坐标是k,四个颜色代表因子n的个数。在给定选k个因子的假设下,试的因子总数越多,能获得的效果也越好。所以仅靠挖掘纯随机的因子,就能得到这么高的效率,可见过拟合是一种稳定存在的现象。
学术界有很多方法来评估是不是过拟合。比如,正交化和自助法就可以在一定程度上达到这个目的。正交化是在截面上把基本面因子真正能预测收益的部分去掉,这样就可以客观评价随机部分。自助法是通过重抽样来构建一个随机部分,即,纯靠运气成分得到的概率分布,这样就可以评价因子在排除运气成分后是否仍然有效。即便如此,我们有了方法,也有了警惕性。但是能用的指标,包括通过各种组合方法得到的指标,实在太多了。比如,Chordia,Goyal,Saretto(2017)使用纯基本面的指标,通过加减乘除的四则混合运算构建了两百万个因子。实验中,他们对data mining做了惩罚,然后找到17个在统计上和经济上都非常显著的因子。这是其中一个,针对美股做的。
有人说,价值和动量这两个因子都很好,长期来看都能挣钱,也是负相关的。所以,似乎这两种择时方法都很不错,把它们组合在一起也没什么毛病。但是它们两个可以同时失效(together we fall),18年下半年就是这样一个情况。可以想象,如果在那时按动量或者按估值择时,也会有一个比较惨的表现。
我们还用刚才那十个因子进行模拟,用最简单粗暴的方法,每年等权配置过去一年涨幅最高的五个因子。在样本内,这种方法确实跑赢了十个因子的等权配置。但问题在于,当动量因子无效造成动量择时无效的时候,因为你择时了,会导致这十张图与前面十张图相比,波动是更高的,5%到95%的区间也变得更宽,收益的中枢也下降得更快。这是因为,样本外的不确定性不仅来自于因子本身的不确定性,还来自于因子失效而造成的择时的不确定性。这一点是在做因子择时的时候,必须要考虑的。任何一种择时方法在样本内一定是非常好使的,因为不好使也不会把这种方法提出来。但是在样本外,如果要评估是否使用因子择时,就一定要考虑这两种不确定性的叠加。