同定から推定まで


9

私は現在、因果関係についてパールの作品(Pearl、2009、第2版)を読んでおり、モデルのノンパラメトリックな同定と実際の推定との間のリンクを確立するのに苦労しています。残念ながら、パール自身はこのトピックについて非常に沈黙しています。

例として、因果パスと、すべての変数w xw zおよびw yに影響を与える交絡因子を持つ単純なモデルを念頭に置いています。さらに、xyは観測されていない影響x yによって関連付けられます。do計算の規則により、介入後(離散)の確率分布が次の式で与えられることがわかりました。xzywxwzwyxyx←→y

P(ydo(x))=w,z[P(zw,x)P(w)x[P(yw,x,z)P(xw)]].

(ノンパラメトリックに、またはパラメトリックな仮定を導入することによって)この量をどのように推定できるのか不思議に思っています。特に、が複数の交絡変数のセットであり、対象となる量が連続している場合は特にそうです。データの合同介入前分布を推定することは、この場合非常に非現実的であるように見えます。誰かがこれらの問題に対処するパールの方法の応用を知っていますか?ポインタをいただければ幸いです。 w


1
xとyの両方に影響する観測されていない要因がある場合、xを実際にランダム化せずにこれを推定することはできないと思います。しかし、因果関係への反事実的なアプローチについてはかなり知っていますが、私はパールのdo計算にあまり詳しくありません(私はまだ彼の本を自分で研究しています)。
エリー

回答:


7

これは非常に良い質問です。まず、数式が正しいかどうかを確認しましょう。入力した情報は、次の因果モデルに対応しています。

ここに画像の説明を入力してください

P(Y|do(X))causaleffectigraph

library(igraph)
g <- graph.formula(X-+Y, Y-+X, X-+Z-+Y, W-+X, W-+Z, W-+Y, simplify = FALSE)
g <- set.edge.attribute(graph = g, name = "description", index = 1:2, value = "U")

X-+Y, Y-+XXY

次に、見積もりを求めます。

library(causaleffect)
cat(causal.effect("Y", "X", G = g, primes = TRUE, simp = T, expr = TRUE))

W,Z(XP(Y|W,X,Z)P(X|W))P(Z|W,X)P(W)

これは実際にあなたの式と一致します---交絡因子が観察されたフロントドアの場合。

XZY

いくつかのデータをシミュレートしましょう:

set.seed(1)
n <- 1e3
u <- rnorm(n) # y -> x unobserved confounder
w <- rnorm(n)
x <- w + u + rnorm(n)
z <- 3*x + 5*w + rnorm(n)
y <- 7*z + 11*w + 13*u + rnorm(n)

XYYZ+W+XZYZX+WXZ

yz_model <- lm(y ~ z + w + x)
zx_model <- lm(z ~ x + w)

yz <- coef(yz_model)[2]
zx <- coef(zx_model)[2]
effect <- zx*yz
effect
       x 
21.37626 

そして推論のために、製品の(漸近)標準誤差を計算するかもしれません:

se_yz <- coef(summary(yz_model))[2, 2]
se_zx <- coef(summary(zx_model))[2, 2]
se <- sqrt(yz^2*se_zx^2 + zx^2*se_yz^2)

テストまたは信頼区間に使用できるもの:

c(effect - 1.96*se, effect + 1.96*se) # 95% CI
       x        x 
19.66441 23.08811 

(非/セミ)パラメトリック推定を実行することもできます。他の手順を含めて、この回答を後で更新します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.