多因子模型的因子有效性检验?

论坛 期权论坛 study     
陈不机智   2018-11-1 06:18   69785   10
对于多因子模型,检验因子有效性的方法有哪些?

如果采用Barra模型中的结构化风险模型,那么在检验因子有效性的时候是多个因子同时检验还是单个因子单独检验?如果用多个因子同时检验那么是一锅烩?还是有筛选的一部分检测?如果针对单个因子单独检验,那么如何排除相互之间的共线性影响?

如果采用排序的检验方法,同样的,如何排除每个单独因子之间的共线性?
分享到 :
1 人收藏

10 个回复

正序浏览
11#
匿名用户   | 2018-11-1 06:18:10 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
10#
匿名用户   | 2018-11-1 06:18:09 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
9#
匿名用户   | 2018-11-1 06:18:08 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
8#
卢星  2级吧友 | 2018-11-1 06:18:07 发帖IP地址来自
因子的显著性检验,可以判断有效性
7#
guiping sun  4级常客 | 2018-11-1 06:18:06 发帖IP地址来自
barra模型中关于风险因子的稳定性检验时,需要计算相邻时间的相关系数,里面用到了回归权重,这个回归权重具体指什么?怎么计算?
6#
「已注销」  8级牛人 | 2018-11-1 06:18:05 发帖IP地址来自
推荐阅读《华泰多因子模型体系初探:华泰多因子系列之一》
5#
优矿量化实验室  4级常客 | 2018-11-1 06:18:04 发帖IP地址来自
[h1]1 多因子模型简单介绍[/h1]预测未来哪支股表现好回报率高,往往需要一个或多个我们可以获得的指标,将它们与未来的股票表现建立联系,进而引导我们的投资。其实质是用变量对股价的波动情况进行拟合,一般而言一个因子是远远不够的。因此今天我们选取多个因子,给它们配以一定的权重合成一个终极因子,用此终极因子来与股票未来收益率建立某种联系,制定出我们的策略,并用历史数据进行检测。
指定多因子策略,我所理解的核心问题就只有两个: 哪些因子   因子的权重
[h1]2 因子的选取[/h1]根据影响市场的情况,我们为了赋予因子可解释的意义,将因子分为以下N类(可能会不全):
估值类因子:PB,PE,PS…代表着市场对于公司价值和表现的预估
盈利类因子:ROA,ROE,Gross Margin…代表着公司的盈利能力
成长类因子:Profit_Growth_Rate,Asset_Growth_Rate…代表着公司的成长能力
波动类因子:股价收益率在一定时间内的标准差…代表着股价的波动情况
情绪类因子:换手率…代表着市场对这支股票的‘情绪’
动量类因子…
分析师类因子…
价值类因子…
在此,我们分别选择EP(市盈率倒数),ROE,TotalProfitGrowRate作为我们的因子(可自行选择),来进行演示。


[h1]3 因子的权重[/h1]因子的权重有多种分配方式(等权,按照近期IC的平均值,按照线性回归系数,人为分配…)根据你想实现的目的而异。
想追求高收益,低风险,最大回撤小…都有着不同的因子权重分配方式,而且有高人不断探索中…
在此,我们探索目前市场上人们都说的表现极好的一种多因子加权方式:
基于IC的IR最大化(究极因子的IC在过去一段时间的平均值除以IC的方差最大)。
什么意思?假设有n个因子:
在某一时刻

这样得到的多因子权重,可以使得终极因子对于未来收益率的相关性保持比较高而且比较稳的性质。
由于我们本次的策略是月度调仓,所以选择过去六个月(120天)来进行某因子IC均值的计算,这样可以保证:
时间不短,协方差矩阵有效反映事实;
时间不长,对于未来不长的时间也有较准确的预测作用。
因此我们来看看代码用这种方法来实现多因子权重的确定以及回测过程。

[h1]3.1多因子的提取(EP,ROE,TotalProfitGrowRate)[/h1][h1]时间时长为2012-06-12到2017-06-12这五年[/h1][h1]月度调仓,但是IC按照日度进行计算[/h1]
查看完整代码请前往优矿量化社区


查看完整代码请前往优矿量化社区



3.2多因子IC(相关系数)的相关计算(pearson系数,按照rank计算)


查看完整代码请前往优矿量化社区


查看完整代码请前往优矿量化社区






查看完整代码请前往优矿量化社区





查看完整代码请前往优矿量化社区



3.4计算alpha和beta

查看完整代码请前往优矿量化社区


[h1]结论:[/h1]可以看出,表现最好的是第五组分位数测试,证明这组因子构成的终极因子与未来收益率呈反比关系。
除了第五组和第一组之外,其余组数表现较为接近,还是可以一定程度说明此多因子模型具有比较好的单调性。
对于把因子归1化并按照因子进行投资的方式,只是我为了保证因子在0到1的范围内的一种方法。也可以对因子进行不同角度的处理,从而确定投资权重。
从alpha和beta的计算可以看出,alpha为22%,很大,beta为1.0839,受市场有一定程度的影响。和图像反应给我们的信息是一致的。(alpha很大,而且策略的收益和市场收益很相似。)
总而言之,按照这种加权方式的多因子策略,可能随着因子选择的不同而差异比较大。
但是总得来说,这种加权方式是根据历史最近一段时间内的真实情况给出的权重,对于较短的将来有不小的借鉴意义,表现不会太差。


本文作者:第几个一百天
4#
太阳风太阳风  3级会员 | 2018-11-1 06:18:03 发帖IP地址来自
之前看过国泰君安的一篇报告,大概叫 基于组合权重优化 。里面对这个问题进行了讲解,可以参考下。
3#
陈小米  3级会员 | 2018-11-1 06:18:02 发帖IP地址来自
这篇是依据丁鹏老师一本书上的理论方法做的实证检验,数据从09-15年,发表在我的专栏文章,供参考
【研究】量化选股-因子检验和多因子模型的构建 - 神秘的宽客们 - 知乎专栏
2#
李大仙  4级常客 | 2018-11-1 06:18:01 发帖IP地址来自
毕业论文就是做的多因子模型。最近工作也在进一步研究。

先简单说一下,有空细说。
如果采用Barra模型中的结构化风险模型,那么在检验因子有效性的时候是多个因子同时检验还是单个因子单独检验?如果用多个因子同时检验那么是一锅烩?还是有筛选的一部分检测?
我的做法是,先单因子检验,剔除不显著的因子。然后用逐步双向F检验确定因子,最好的结果是双向确定的因子相同。
如果针对单个因子单独检验,那么如何排除相互之间的共线性影响?如果采用排序的检验方法,同样的,如何排除每个单独因子之间的共线性?
这个在Barra的文章中有提到的,在检验前要进行因子间的正交化,比如size和nonlinear-size如果不进行正交化过滤的话,VIF会非常高。

嗯,先这样,去搬砖了。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:69
帖子:5
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP