工具变量
工具变量(IV)处理这样的情况:在存在未观察到的混淆变量,其同时影响治疗 \(X\) 和结果 \(Y\) 时,对因果效应进行估计。一组变量 \(Z\) 被称为一组 工具变量 如果对于 任何在 \(Z\) 中的 \(z\) 。
\(z\) 对 \(X\) 有因果效应。
\(z\) 对 \(Y\) 的因果效应完全由 \(X\) 调节。
从 \(z\) 到 \(Y\) 没有后门路径。
在这样的情况下,我们必须首先找到IV(其可以通过使用 CausalModel
完成,参考 识别 )。举个例子,变量 \(Z\) 在下面的图中
可以作为一个合理的IV,在存在未观察到的混淆变量 \(U\) 时估计 \(X\) 对 \(Y\) 的因果效应。
YLearn关于IV实现两个不同的方法:deepiv [Hartford] ,对IV使用深度学习模型和IV的无参数模型 [Newey2002] 。
IV框架和问题设置
IV框架的目的是预测结果 \(y\) 的值当治疗 \(x\) 给定时。除此之外,还存在一些协变量向量 \(v\) 其同时影响 \(y\) 和 \(x\)。 还有一些未观察到的混淆因素 \(e\) 其潜在影响 \(y\) ,\(x\) 和 \(v\) 。因果问题的核心部分是估计因果量。
\[\mathbb{E}[y| do(x)]\]
下面的因果图,其中因果关系的集合由函数的集合决定
\[\begin{split}y & = f(x, v) + e\\
x & = h(v, z) + \eta\\
\mathbb{E}[e] & = 0.\end{split}\]
IV框架通过做两步估计解决这个问题:
估计 \(\hat{H}(z, v)\) 其捕获在 \(x\) 和变量 \((z, v)\) 之间的关系。
用预测的结果 \(\hat{H}(z, v)\) 取代 \(x\) 给定 \((v, z)\) 。接着估计 \(\hat{G}(x, v)\) 来构建 \(y\) 和 \((x, v)\) 之间的关系。
最终的因果效应能够被计算。