工具变量

工具变量（IV）处理这样的情况：在存在未观察到的混淆变量，其同时影响治疗 \(X\) 和结果 \(Y\) 时，对因果效应进行估计。一组变量 \(Z\) 被称为一组 工具变量 如果对于任何在 \(Z\) 中的 \(z\) 。

\(z\) 对 \(X\) 有因果效应。

\(z\) 对 \(Y\) 的因果效应完全由 \(X\) 调节。

从 \(z\) 到 \(Y\) 没有后门路径。

在这样的情况下，我们必须首先找到IV（其可以通过使用 CausalModel 完成，参考识别）。举个例子，变量 \(Z\) 在下面的图中可以作为一个合理的IV，在存在未观察到的混淆变量 \(U\) 时估计 \(X\) 对 \(Y\) 的因果效应。

../../_images/iv3.png — Causal graph with IV

YLearn关于IV实现两个不同的方法：deepiv [Hartford] ，对IV使用深度学习模型和IV的无参数模型 [Newey2002] 。

IV框架和问题设置

IV框架的目的是预测结果 \(y\) 的值当治疗 \(x\) 给定时。除此之外，还存在一些协变量向量 \(v\) 其同时影响 \(y\) 和 \(x\)。还有一些未观察到的混淆因素 \(e\) 其潜在影响 \(y\) ，\(x\) 和 \(v\) 。因果问题的核心部分是估计因果量。

\[\mathbb{E}[y| do(x)]\]

下面的因果图，其中因果关系的集合由函数的集合决定

\[\begin{split}y & = f(x, v) + e\\ x & = h(v, z) + \eta\\ \mathbb{E}[e] & = 0.\end{split}\]

../../_images/iv4.png — Causal graph with IV and both observed and unobserved confounders

IV框架通过做两步估计解决这个问题：

估计 \(\hat{H}(z, v)\) 其捕获在 \(x\) 和变量 \((z, v)\) 之间的关系。

用预测的结果 \(\hat{H}(z, v)\) 取代 \(x\) 给定 \((v, z)\) 。接着估计 \(\hat{G}(x, v)\) 来构建 \(y\) 和 \((x, v)\) 之间的关系。

最终的因果效应能够被计算。

工具变量

IV框架和问题设置

IV Classes