首发于EconPaper
非线性DID模型——CIC模型的识别

非线性DID模型——CIC模型的识别

双重差分模型(DID)是实证经济学中非常常用的一个方法。如果对DID模型不熟悉,可以看我的专栏文章:zhuanlan.zhihu.com/jing作为简要的介绍。

然而实际应用中,双重差分模型却有着非常强的假设。一个最为重要的假设是所谓的「common trend」假设,即控制组和处理组在没有经过处理的时候,其结果变量的趋势是一样的。

但是如果仔细想一下,双重差分模型对于结果变量的变换不是不变的。一个简单的例子是,如果关心的结果是收入,A的收入为1w,B的收入为2w。如果我们拿收入水平作为y,那么双重差分模型的潜在假设是收入增长的幅度是一样的,比如下一期A的收入如果变成了1.5w,B的收入应该为2.5w。而如果我们假设ln(income)作为y,那么如果A的收入变成了1.5w,B的收入应该为3w。所以在不同的设定下,common trend假设对任意单调变换是不可能同时成立的。

那么有没有可能对DID模型进行非线性甚至非参数的扩展呢?Susan Athey以及Imbens 于2006年发表在Econometrica上的文章《Identification and Inference in Nonlinear Difference-in-Differences Models》讨论了DID模型的非参数扩展——Changes-in-changes模型。

这篇文章内容非常丰富,分别讨论了CIC模型的识别、推断、与Quantile DID的区别、对离散结果变量的推广等等问题,限于篇幅,在这里我只介绍文章最核心的思想:CIC模型的识别。

假设可以观察到i.i.d 的三元组(Y, D, T),其中Y为结果变量,D为区分控制组、实验组的indicator,T为时间的indicator,I=D·T 为处理的indicator,观察到的Y实际为:

其中Y^N为没有经过处理的潜在的Y,而Y^I为经过处理的潜在的Y。假设未处理的Y其数据生成过程为:

且h为u的单调增函数。对比一下DID模型,实际上假设了:

如果设U=G+ε,那么DID模型就成了以上CIC模型设定的特例,而CIC模型的假设给位一般化。

CIC模型的关键假设是,给定分组G,不可观察的变量U是时间平稳的,即 U⊥T|G,而DID模型实际上假设了ε不仅仅在时间上是平稳的,而且与G也是不相关的。此外,为了达到反事实的分布函数的完整识别,还必须假设U_1的support包含于U_0的support之内。

计Y^N,Y^I,Y,U给定g, t的分布函数分别为:

文章的一个关键结论是:

注意Y^N_11的分布函数是我们看不到的,而其他三个分布函数都可以从数据中得到。从而,使用三个可以观测到的分布函数,这个公式得到了观察不到的Y^N_11的分布函数。这个结论的证明也相对简单,感兴趣的读者可以参考原文,而文章中提供了一幅图可以直接显示清楚:

过程是这样的。对于一个处理组第0期的y(下图中的y),我们可以找到控制组的对应的第0期的y值,及其分布函数值(q')。由于假设了Y^N对U是单调的,且给定G,U与T是独立的,因而可以直接找到q'对应的控制组第1期的分布函数对应q'的点,其对应的y'与y的差值就是给定U控制组的y的变化大小,从而得到了处理组在第1期的conterfactural。下图的白线即为得到的处理组第一期的反事实分布。

此外,仔细观察以上的过程,CIC模型还有一个好处是,CIC只需要repeated cross section数据,而不一定使用面板数据。

有了以上的变换之后,平均处理效应可以写为:

注意以上的过程并没有对h函数做任何假设,因而整个的识别过程是非参数的。CIC模型极大的放松了DID模型的各个假设,的确是非常有吸引力的一个方法。对于CIC模型的推断及在离散结果变量等情形的拓展,可以查看原文,这里不再赘述。

发布于 2016-01-31

文章被以下专栏收录