香樟青苗
当前位置是: 网站首页 -- 学术科研 -- 香樟青苗 -- 正文

香樟青苗简报|江艇:因果推断专题

发布日期:2023-08-03   点击量:

2023724日晚,中国人民大学世界杯英格兰队vs丹麦队谁会赢? 副教授江艇老师为第六期香樟青苗计划的学员们进行了主题为“因果推断专题:敏感性分析”的精彩线上讲座。

图片

嘉宾简介

江艇,中国人民大学世界杯英格兰队vs丹麦队谁会赢? 副教授,兼任中国人民大学国家发展与战略研究院研究员,中国人民大学微观数据与实证方法研究中心副主任,美国哥伦比亚大学商学院访问学者。主要研究领域为经济增长与发展、城市经济学、新政治经济学,在Economics LettersReview of Development Economics、《经济研究》、《管理世界》、《世界经济》等国内外著名学术刊物上发表多篇论文,曾应邀在多所高校讲授“应用微观计量经济学”短期前沿课程并广受好评。

 

讲座开篇,江老师指出社会科学中的因果识别问题依赖于关键的识别假设,而其往往无法从数学或统计上被严格论证。因此,经济学研究者试图寻找理想的研究情境,以满足特定的识别假设,从而达到因果推断的目的。一种理想的研究情境是随机实验,全样本被分配到实验组与对照组的随机性使得无论在参数识别还是非参数识别的框架下均满足关键的均值独立假设,这意味着组间均值的差异可被用于识别因果效应。当然,随机实验过于理想,以至于在现实研究中很难满足,绝大多数社会科学的数据都是观测数据,研究者无法介入数据的生成过程。这对因果识别提出了更高的要求,研究者通常借助“自然实验”才能进行准确、干净的识别。但是“自然实验”可遇不可求,当存在“自选择”问题时,组间均值的差异不能再反映因果效应。

处理的“自选择”问题,是观测性研究的根本挑战。这种选择性具体可分为两种:其一,基于可观测变量的选择性,这意味着个体接受处理的选择只取决于可观测的变量,一旦给定这些可观测变量,接受处理与否再次变得近似随机。在此情形下,关键的识别假设由均值独立变为条件均值独立,因果识别的逻辑与前述一致,差别在于参数识别框架存在隐含假设:因果效应不随控制变量的变化而变化,而非参数识别框架很好地捕捉了这种异质性。其二,基于不可观测变量的选择性。这意味着个体接受处理的选择还受到其他不可观测变量的影响,因此违背了条件均值独立的假设,从而无法将比较局限在控制变量相同的总体内以考察因果效应。此时,给定当前选用的可观测控制变量,核心解释变量与遗漏的不可观测变量不满足均值独立,这自然地使得研究者们对因果效应的估计结果提出质疑。因此,如何评估因果效应的估计结果对于潜在不可观测变量选择性的敏感性,成为研究者关心的重要问题。

已有研究就敏感性分析的度量提出了不同的见解,江老师逐一娓娓道来。第一,基于Imbens方法[Guido W. Imbens (2003). Sensitivity to Exogeneity Assumptions in Program Evaluation. American Economic Review]。该方法将不可观测变量引入方程,并对其分布进行建模,采用最大似然估计的方法估计出核心参数后据此计算出拟合优度作为敏感性参数,来评估处理效应的大小。

第二,BM方法,即基于系数的敏感性参数[John Bellows and Edward Miguel (2008). War and Local Collective Action in Sierra Leone. Journal of Public Economics]。该方法借助包含部分控制变量的短回归与包含全部控制变量的长回归,其核心在于比较长回归与短回归中由于新加入的可观测控制变量所带来的解释力度增加与潜在不可观测变量可能导致的解释力度增加的幅度大小。实操层面,可根据长回归与短回归的系数计算出Selection Ratio(SR),一般认为SR至少不能小于1才能够通过敏感性分析。

第三,Krauth方法,即基于相关系数的敏感性参数[Brian Krauth (2016). Bounding a Linear Causal Effect Using Relative Correlation Restrictions. Journal of Econometric Methods]。该方法将随机扰动项分解为可观测变量部分与不可观测变量部分,通过简单数学变形将可观测变量部分表示为核心解释变量估计结果β的函数,SR由可观测变量部分与不可观测变量部分分别与核心解释变量的相关系数作比得到,因此也可以表示为β的函数,通过计算β=0时对应的SR即可展开敏感性分析。

第四,AET方法,即基于线性投影系数的敏感性参数[Joseph G. Altonji, Todd E. Elder, and Christopher R. Taber (2005). Selection on Observed and Unobserved Variables: Assessing the Effectiveness of Catholic Schools. Journal of Political Economy]。该方法同样将随机扰动项分解为可观测变量与不可观测变量两部分,分别定义不可观测变量的选择性与可观测变量的选择性,并将两者的比值作为SR。该方法与Krauth方法的区别在于分别以方差与标准差对协方差进行标准化。在原假说β=0下,通过一系列回归可以计算出SR的数值,SR远小于1时则意味着原估计结果没有通过敏感性分析。

第五,Oster的双参数方法[Emily Oster (2019). Unobservable Selection and Coefficient Stability: Theory and Evidence. Journal of Business & Economic Statistics]。该方法在某种程度上可认为是对于BM方法与AET方法的修正,其能够避免BM方法在可观测变量的解释力较弱情形时错误通过敏感性分析,也能够克服AET方法只适用于β=0原假设的局限性。具体而言,该方法采用与AET方法相同的方式定义不可观测变量相对于可观测变量的选择性,此外,Oster方法还定义了被解释变量对核心解释变量、可观测变量与不可观测变量回归时的拟合优度Rmax²。当假设可观测变量对核心解释变量的相对贡献和它们对被解释变量的相对贡献相同时,可将由不可观测变量导致的估计偏误表示为SRRmax²的函数,对于Rmax²的不同设定对应着前述的BM方法与AET方法;而当该假设不满足时,可求解给定SRRmax²时的估计偏误,也可以根据估计偏误和Rmax²确定唯一的SR,均可作为敏感性分析的判据。

第六,基于CH方法[Carlos Cinelli and Chad Hazlett (2020). Making Sense of Sensitivity: Extending Omitted Variable Bias. Journal of the Royal Statistical Society Series B: Statistical Methodology]。该方法构建了两个无法通过实际回归计算得到的偏拟合优度,通过计算稳健值、进行极端情形分析等方式,将稳健值、极端情形的基准值与偏拟合优度的上限做比较,据此判断估计结果能否通过敏感性分析。

最后,同学们在线上积极提问,江老师为大家一一详细解答。江老师深入浅出、化繁为简的讲解为学员们带来了有关因果推断的深刻洞见。再次感谢江艇老师为第六期香樟青苗学员们带来的精彩讲座!

版权所有 © 世界杯英格兰队vs丹麦队竞猜    邮编:102488

地址:北京市房山区长于大街11号