因果関係は数学的にどのように定義されていますか?


16

2つのランダム変数間の因果関係の数学的な定義は何ですか?

2つのランダム変数との共同分布からのサンプルが与えられた場合、が引き起こすのはいつだろうか?XYXY

文脈のために、私は因果発見に関するこの論文を読んでいます。


2
私が見る限り、因果関係は数学的な概念ではなく科学的な概念です。編集して明確にすることはできますか?
mdewey

2
@mdewey私は同意しません。因果関係は完全に正式な条件で現金化できます。例えば私の答えをご覧ください。
Kodiologist

回答:


9

2つのランダム変数間の因果関係の数学的な定義は何ですか?

数学的には、因果モデルは変数間の機能的な関係で構成されています。たとえば、以下の構造方程式系を考えてみましょう:

バツ=fバツϵバツy=fyバツϵy

これは、機能的にの値を決定することを意味します(介入すると、の値が変更されますバツyバツy)が、その逆ではありません。グラフィカルに、これは通常バツyで表されます。これは、バツがyの構造方程式に入ることを意味します。補遺として、因果モデルを反事実変数の共同分布の観点から表現することもできます。これは、機能モデルと数学的に同等です。

2つのランダム変数XとYの共同分布からのサンプルが与えられた場合、XがYを引き起こすのはいつでしょうか?

時々(またはほとんどの場合)、構造方程式fバツfyの形状について、あるいはバツyyバツかどうかについても知識ありません。持っている唯一の情報は、同時確率分布pyバツ(またはこの分布からのサンプル)です。

これはあなたの質問につながります。いつデータから因果関係の方向を回復できますか?または、より正確には、データからバツyの構造方程式に入るか、その逆になるかをいつ回復できますか?

もちろん、因果モデルに関する根本的にテスト不可能な仮定がなければこれは不可能です。問題は、いくつかの異なる因果モデルが観測変数の同じ結合確率分布を必要とする可能性があることです。最も一般的な例は、ガウスノイズを伴う因果線形システムです。

しかし、いくつかの因果的な仮定の下では、これは可能かもしれない---そしてこれは、因果発見の文献が機能するものである。このトピックに以前に触れたことがない場合は、Peters、Janzing、Scholkopfによる「因果推論の要素」、およびJudea Pearlによる「因果関係」の第2章から始めてください。因果発見に関する参考資料として、CVに関するトピックがありますそこにはまだそれほど多くの参考文献がリストされていません。

したがって、あなたの質問に対する答えは1つだけではありません。なぜなら、それは1つの仮定に依存するからです。あなたが言及する論文は、非ガウスノイズを伴う線形モデルを仮定するなど、いくつかの例を引用しています。このケースはLINGAN(線形非ガウス非循環モデルの略)として知られています。ここに例を示しRます:

library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1

# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat") 

# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
#     [,1]  [,2]
# [1,] .     .   
# [2,]  TRUE .     

ここで、バツ2バツ1を引き起こし、lingamが因果方向を正しく回復する、非ガウスノイズの線形因果モデルがあることに注意してください。ただし、これ LINGAMの仮定に大きく依存していることに注意してください。

あなたが引用した論文の場合、彼らはこの特定の仮定をします(「仮定」を参照):

バツy

pバツyバツyyバツpyバツ

最後の発言として、因果的発見の結果は依然として非常に限定的であり、強い仮定に依存しています。これらを実世界の状況に適用する場合は注意してください。


1
何らかの方法で偽のデータを含む簡単な例含めて回答を増やす可能性はありますか?たとえば、因果推論の要素を少し読んで、ピーターズの講義のいくつかを見て、回帰フレームワークを使用して、問題を詳細に理解する必要性を動機付けします(ICPの作業については触れていません)。私は、RCMから離れようとするあなたの努力において、実際のすべての有形のモデリングマシンがあなたの答えから除外されているという印象を持っています。
usεr11852が復活モニック言う

1
@usεr11852私はあなたの質問の文脈を理解しているかどうかわかりません、因果関係の発見の例が欲しいですか?ジェーンが提供したまさにその論文にはいくつかの例があります。また、「RCMを回避して実際の有形のモデリングマシンを除外する」という意味がわからないのですが、ここでの因果的発見のコンテキストではどのような有形のマシンが欠けているのでしょうか。
カルロスチネリ

1
混乱をおologiesびしますが、私は論文の例を気にしません。他の論文を自分で引用することができます。(例えば、ロペス・ラパスら。彼らの神経因果関係係数についてCVPR 2017)私が気にすることで、簡単な数値例のためである偽のデータ誰かのR(またはお好みの言語)での走行とは、あなたが何を意味するか見ること。たとえば、Peters 'et al。本と彼らは非常に有用な小さなコードスニペットを持っています(そして時々だけを使用しますlm)。因果発見のアイデアを得るために、チュービンゲンデータセットの観測サンプルをすべて回避することはできません。:)
usεr11852は回復モニック言う

1
@usεr11852確かに、偽の例を含むことは些細なことですが、Rでリンガムを使用するものを含めることができます。
カルロスチネリ

2
@usεr11852OKフィードバックに感謝します。必要に応じて、より多くのコードを含めるようにします。最後の発言として、因果的発見の結果は依然として非常に限られているため、状況に応じてこれらを適用する際には非常に注意する必要があります。
カルロスチネリ

4

Y1Y2Y1Y2Y1=Y2

変数間の因果関係は、方向性のある非線型グラフで表すこともできます。これは、非常に異なるフレーバーを持ちますが、Rubinモデルと数学的に同等であることがわかります(Wasserman、2004、section 17.8)。

Wasserman、L.(2004)。すべての統計:統計的推論の簡潔なコース。ニューヨーク、NY:スプリンガー。ISBN 978-0-387-40272-7。


ありがとうございました。共同配布からのサンプルのセットが与えられた場合、それに対するテストは何でしょうか?
ジェーン

3
私はarxiv.org/abs/1804.04622を読んでいます。私はその参考文献を読んでいません。観測データに基づいた因果関係によって、その意味を理解しようとしています。
ジェーン

1
Y1Y2バツY

2
バツy=バツ3+ϵϵ

2
@Janeは、観察の場合(質問の場合)、一般に、少なくとも2つの変数の場合について、純粋に数学的に因果関係の方向を推測することはできません。より多くの変数については、追加の(テスト不可能な)仮定の下で主張をすることができますが、結論はまだ疑問視されます。この議論は非常に長いコメントです。:)
Vimal

0

バツY

  1. バツY

介入は、依存する変数に影響を与えない変数への外科的変更です。構造方程式と因果的なグラフィカルモデルでの介入は厳密に形式化されていますが、私が知る限り、特定のモデルクラスに依存しない定義はありません。

  1. Yバツ

バツY

因果関係に対する現代のアプローチでは、介入は因果関係を定義する原始的なオブジェクトとみなされます(定義1)。しかし、私の意見では、介入はシミュレーションダイナミクスの反映であり、シミュレーションのダイナミクスと必然的に一貫しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.