交互项去中心化，是为了去多重共线？

交互项去中心化，是为了去多重共线？

（一）基本原理
在实证过程中，经常使用交互项，一般会对连续变量进行去中心化处理。很多文献解释说去中心化为了消除多重共线。果真如此？在计量和统计领域，消除共线的唯一办法是增大样本。其他的处理方法，要么会导致参数的不一致问题，要么就是自欺欺人的方法。在实证分析中，加入交互项，很多时候都会产生共线问题，一般意识到共线问题，也不会去讨论该问题，因为根本没有办法解决这一问题。去中心化的具体含义请参考这篇论文，该文较详细阐述了为什么要采用中心化处理（https://mp.weixin.qq.com/s/juY63xvhpCUAVPW_7j4PDQ）。
假设不去中心化的模型为：

由（2）式和（4）式可知，二者估计系数完全一样，除了常数项发生改变，进一步可知，对交互项中心化处理即可，主要变量是否中心化并不重要。

综上，上面三种方法计算的系数，可以使用上面的几个方程相互计算得到。相应的，系数的标准差也可以使用上面三个方程计算出来。也就是说，如果做了去平均的回归，那么不去平均的回归结果（包括系数和方差）用上面几个方程就可以算出来；如果做了不去平均的回归，那么去平均的回归结果（包括系数和方差）用上面几个方程也可以算出来。

去中心化解决了多重共线性？笑而不语？

（二）模拟说明
为了进一步说明问题，本文采用模拟数据，说明去中心化是否为了去多重共线。代码如下：

由于数据为模拟产生，无论采用哪种方法估计都可以得到较准确的回归结果。
tsset id year

*OLS
reg y x* i.year
est sto m1

*FE
xtreg y x* i.year,fe
est sto m2

*RE
xtreg y x* i.year
est sto m3
local mm "m1 m2 m3"esttab `mm', mtitle(`mm')b(%6.3f) compress nogaps ///star(* 0.1 ** 0.05 *** 0.01) drop(*year) ///scalar( r2 r2_w N F)
结果如下：

接着：

配合着描述性统计：

可以轻易的验证上面的三个主要方程是成立的，都可以互相推导得到。特别是，去不去平均交叉项的系数和标准误都是完全一样。

（三）多重共线再验证

相关系数小了很多哎！难道不是解决了多重共线性？
要注意，多重共线性是要看偏相关系数的，实际上，如果我们做这样的回归看膨胀因子：

同时两个回归的R-squared基本上是一样的。

在一些实证中，也有人说了，去平均之后的确更容易显著啊！难道不是因为多重共线性吗？

不是的。去平均之后更容易显著是因为，去平均之后x1和x2前面的系数都不一样了，参考我上面写的三个方程的结论，相当于加上了一个系数，所以更容易显著了。当然，这也不是绝对的，比如在上面的模拟里面中，可以通过一个特殊的设定去平均之后也有可能更不显著了。所以在实证分析中，可能会遇得到交互项中主效应不显著, 交互项显著，这样怎么处理的问题，请参考（参考）。

注意我在这里仅仅是说去平均这一做法不是为了解决多重共线性问题，而没有说去平均这个做法是错的。实际上，去平均才是比较标准的做法。
计算下偏效应，可以得到：

也就是说，去平均之后的x1的系数才是x1对y的平均影响。如果x1的系数不显著，但是交叉项的系数是显著，说明平均而言x1对y是没有影响的，但x1对y是有影响的，其影响随着x2的不同而变化。只是在总体上平均而言，x1对y 没有影响。

综上，其实去不去平均这两种做法是等价的，只不过去平均之后的系数更容易解释，所以我们一般做回归的时候会去平均处理。这个跟多重共线性没有任何关系。
这里给我们的一个启发就是，当我们阅读回归表格的时候，特别是遇到交叉项的时候，一定要结合着描述性统计去看。比如，有的回归结果去平均是不显著的，那么会报告不去平均得到的显著结果，这个时候如果配合着描述性统计，配合上面的几个个式子，就能还原回真正的平均偏效应了。由于部分写论文的，想得到显著结果，故意这么处理，也属于……

参考资料1

参考资料2：
https://zhuanlan.zhihu.com/p/26257159

感谢大家2019年的支持，希望2020突破500粉丝，搜索ZFB口令红包：2020粉丝破500

交互项去中心化，是为了去多重共线？

浏览过的版块