省略された変数がない場合、回帰は原因ですか?


13

と両方に影響を及ぼす変数が省略されている場合、でのの回帰は因果関係である必要はありません。しかし、省略された変数と測定誤差がない場合、回帰は原因ですか?つまり、すべての可能な変数が回帰に含まれている場合はどうでしょうか?yバツバツy


4
いいえ、たとえ世界のすべての変数を含めたとしても、逆の因果関係になる可能性があります。たとえば、最も近い星への惑星の近接は、惑星の表面温度によって正確に予測できますが、明らかに因果関係は逆になります
-gazza89

@ gazza89-それが質問に効果的に答えるので、あなたはそれを答えに拡張したいかもしれません。
jbowman

3
「省略された変数」とは何ですか?データセットに1つのYと4つのXがあるとします。4つのXをすべて含むモデルに適合します。次に、省略された変数はありませんか?
user158565

回答:


20

いいえ、そうではありません。いくつかの反例を示します。

最初は逆因果です。因果モデルがYバツであると考えてください。ここで、バツYは標準ガウス確率変数です。その後、E[Y|doバツ]=0ため、バツ発生しないYが、E[Y|バツ]バツ依存します。

2番目の例は、コライダーの制御ですこちらを参照)。因果モデルバツZYを考えます。つまり、バツYを引き起こさず、Zは一般的な原因です。しかしノートあなたが含む回帰を実行した場合、というZ、の回帰係数バツ一般的な原因のコンディショニングとの間の関連性を誘導しますので、ゼロではありませんYバツ(あなたが井戸として、ここで確認したいことがあり存在下でのパス解析条件付きコライダー)。

より一般的には、回帰に含まれる変数がバックドア基準を満たす場合、X上のYの回帰は原因となりますバツ


3
ユダヤ・パールの「なぜの書」を強くお勧めします。カルロスが何を指しているのかを徹底的に説明します。
マルコスカシオウリス

3
何がの平均?doバツ
-naught101

5
@ naught101それはあなたが実際にX = X、受動的観測とは対照的に、X = X、ここを参照してください強制意味stats.stackexchange.com/questions/211008/dox-operator-meaning/...
カルロスチネリ

感謝しますが、表記については明確ではありません。DOES 平均Zが原因XYの?矢印を逆にする必要がありますか?バツZYZバツY
エシャ

@Esha yの両方がzを引き起こすことを意味するバツyz
Carlos Cinelli

6

この質問に対するCarlos Cinelliの重要な答えに加えて、回帰係数が原因ではない可能性があるという理由がいくつかあります。

第一に、モデルの仕様の誤りにより、パラメーターが非因果的になる可能性があります。モデルに関連するすべての変数があるからといって、正しい方法で調整したわけではありません。非常に単純な例として、0の周りに対称的に分布する変数バツを考えてみましょう。結果変数Yが、E Y X = X 2のような方法でバツ影響を受けると仮定します。(X 2ではなく)XでYを回帰すると、Xの推定係数が得られます。EYバツ=バツ2Yバツバツ2バツY影響するすべての(唯一の)変数を調整したにもかかわらず、明らかにバイアスがかかった約0の値。

第二に、逆因果関係のトピックに関連して、選択バイアスを持つ可能性があるというリスクもあります。つまり、推論を導きたい母集団を代表しないようにサンプルが選択されているというリスクです。さらに、データがランダムに完全に欠落していない場合、データの欠落によってバイアスが生じる可能性もあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.