关于PSM的相关问题
老师,您好!我在论文写作时有以下两个问题:
1.在进行倾向得分匹配之后,我看到有直接利用报告的ATT值进行分析的情况,也有再筛选出匹配成功的样本进行OLS回归利用回归系数说明影响的情况。这两种方法都可以吗?还是用哪种更好一些。
2.我在对全样本进行匹配之后,想要按全样本进行分组直接得到各分组情况的ATT值,这个有单独的命令吗?
1.OLS回归和PSM都存在着一些局限性,当然为什么还使用PSM,首先,当我们选择利用logit模型来估计倾向值得分,并在第二阶段得到ATT时,PSM是一种半参的估计方法,它也会存在模型设定偏误的问题。其次,有些研究者将那么不在共同支撑域内的样本剔除后,用OLS回归方法来拟合共同支撑域内的样本。这种方法是否可取?我觉得并不可取,我们知道在估计了倾向值得分之后,PSM的第二步采用了诸多方法将倾向得分几乎相同的处理组和对照组匹配起来,从而比较他们之间的结果差异,最终通过加权平均得到了ATT、ATU和ATE。而利用OLS拟合共同支撑域的样本,它存在很多缺陷,一是模型设定偏误问题,OLS估计是一种参数估计,参数估计都有可能存在模型设定偏误问题;二是,它并未将处理组和对照组按照倾向得分匹配起来,而是将所有样本进行线性拟合,(实际值-拟合值)的平方和最小时返回的系数值,就是估计值。都是两阶段估计,但效果不一样。建议以PSM的估计结果为准。
不管怎么样,PSM和OLS都只是基于可观测变量的控制,而对于不可观测的因素,PSM和OLS能否有效地控制,我们不得而知。因此PSM和OLS都需要进行敏感性分析,以检验遗漏变量问题。OLS使用konfound命令来检验,PSM通常用rbound、mhbounds或sensimatch,这也是当前很多中文期刊忽视的地方,建议审稿人严格把关。
2. 建议采用kmatch这个命令,用over(分组变量),非常方便。当然你还需要比较组别之间的系数是否存在显著差异,利用lincom这个命令,例如lincom [0]ATE - [1]ATE。
往期回顾:
互助问答第306期:关于非线性面板回归的问题
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”。任何侵权行为将面临追责!)
学术指导:张晓峒老师 Ben Lambert
本期解答人:李后建老师
编辑:李盺琪
统筹:左川 易仰楠
技术:刘子瑗
全文完,感谢您的耐心阅读
请顺手点个“在看”吧~
阅读原文
|