2つのランダム変数間の因果関係の数学的な定義は何ですか?
2つのランダム変数との共同分布からのサンプルが与えられた場合、が引き起こすのはいつだろうか?
文脈のために、私は因果発見に関するこの論文を読んでいます。
2つのランダム変数間の因果関係の数学的な定義は何ですか?
2つのランダム変数との共同分布からのサンプルが与えられた場合、が引き起こすのはいつだろうか?
文脈のために、私は因果発見に関するこの論文を読んでいます。
回答:
2つのランダム変数間の因果関係の数学的な定義は何ですか?
数学的には、因果モデルは変数間の機能的な関係で構成されています。たとえば、以下の構造方程式系を考えてみましょう:
これは、機能的にの値を決定することを意味します(介入すると、の値が変更されます)が、その逆ではありません。グラフィカルに、これは通常で表されます。これは、がyの構造方程式に入ることを意味します。補遺として、因果モデルを反事実変数の共同分布の観点から表現することもできます。これは、機能モデルと数学的に同等です。
2つのランダム変数XとYの共同分布からのサンプルが与えられた場合、XがYを引き起こすのはいつでしょうか?
時々(またはほとんどの場合)、構造方程式、の形状について、あるいはかかどうかについても知識がありません。持っている唯一の情報は、同時確率分布(またはこの分布からのサンプル)です。
これはあなたの質問につながります。いつデータから因果関係の方向を回復できますか?または、より正確には、データからがの構造方程式に入るか、その逆になるかをいつ回復できますか?
もちろん、因果モデルに関する根本的にテスト不可能な仮定がなければ、これは不可能です。問題は、いくつかの異なる因果モデルが観測変数の同じ結合確率分布を必要とする可能性があることです。最も一般的な例は、ガウスノイズを伴う因果線形システムです。
しかし、いくつかの因果的な仮定の下では、これは可能かもしれない---そしてこれは、因果発見の文献が機能するものである。このトピックに以前に触れたことがない場合は、Peters、Janzing、Scholkopfによる「因果推論の要素」、およびJudea Pearlによる「因果関係」の第2章から始めてください。因果発見に関する参考資料として、CVに関するトピックがありますが、そこにはまだそれほど多くの参考文献がリストされていません。
したがって、あなたの質問に対する答えは1つだけではありません。なぜなら、それは1つの仮定に依存するからです。あなたが言及する論文は、非ガウスノイズを伴う線形モデルを仮定するなど、いくつかの例を引用しています。このケースはLINGAN(線形非ガウス非循環モデルの略)として知られています。ここに例を示しR
ます:
library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1
# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat")
# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
# [,1] [,2]
# [1,] . .
# [2,] TRUE .
ここで、がを引き起こし、lingamが因果方向を正しく回復する、非ガウスノイズの線形因果モデルがあることに注意してください。ただし、これは LINGAMの仮定に大きく依存していることに注意してください。
あなたが引用した論文の場合、彼らはこの特定の仮定をします(「仮定」を参照):
最後の発言として、因果的発見の結果は依然として非常に限定的であり、強い仮定に依存しています。これらを実世界の状況に適用する場合は注意してください。
lm
)。因果発見のアイデアを得るために、チュービンゲンデータセットの観測サンプルをすべて回避することはできません。:)
変数間の因果関係は、方向性のある非線型グラフで表すこともできます。これは、非常に異なるフレーバーを持ちますが、Rubinモデルと数学的に同等であることがわかります(Wasserman、2004、section 17.8)。
Wasserman、L.(2004)。すべての統計:統計的推論の簡潔なコース。ニューヨーク、NY:スプリンガー。ISBN 978-0-387-40272-7。