相関はどのような条件下で因果関係を意味しますか?


85

私たちは皆、「相関関係は因果関係を意味するものではない」というマントラを知っています。アイデアを説明するための良い例がここにあります。

しかし、相関因果関係を意味する場合があります。次の例は、このウィキペディアのページから取っています

たとえば、テストで一貫して同じグレードを取得することがわかっている一卵性双生児で実験を実行できます。1人の双子は6時間勉強するために送られ、もう1人は遊園地に送られます。彼らのテストスコアが突然大幅に分岐した場合、これは学習(または遊園地に行く)がテストスコアに因果関係を持っているという強力な証拠になります。この場合、学習スコアとテストスコアの相関関係は、ほぼ確実に因果関係を意味します。

相関が因果関係を意味する他の状況はありますか?


16
相関関係とリンクの強力な根本的理由は、そうでないことが証明されるまで因果関係があることを示唆しています。
ジェームズ

8
人が因果関係を確立できないと言ったのはカール・ポッパーではありません:科学理論は本質的に抽象的です。彼らは反証することができ、私たちは何かを偽造の困難をencouterているという事実は、私たちは因果関係について考えさせる...
ロビンジラール

3
Jaynesの興味深い反例:「雲なし」は「雨なし」を意味する演ductive的な関係があります。「雲なし」が「雨なし」の物理的原因であると誰が信じるでしょうか?
確率

4
辞書でその意味には1.
提案

双子の例は理にかなっていますか?私が意味する因果関係は、研究方法/体制の違いが双子のテストスコアの違いを引き起こすということです。しかし、それは1つのサンプルであり、大きなサンプルであっても、仮説を破る反対の反応を持っている1組の双子、ブラックスワンスタイル... @probabilityislogic:「雲なし」という概念は物理的です意味?はいの場合、2番目の部分が信じられない理由がわかりません。
-naught101

回答:


33

因果関係には相関関係では不十分です。ウィキペディアの例を回避するには、それらの双子が答えを提供するデバイスを持っていることによって、テストで常にだまされていることを想像してください。遊園地に行く双子はデバイスを失い、したがって低学年です。

このようなものをまっすぐにする良い方法は、Pearlの著書Causalityで行われているように、測定された量を生成する可能性のあるベイジアンネットワークの構造を考えることです。彼の基本的なポイントは、隠された変数を探すことです。測定されたサンプルで変動しない隠れ変数がある場合、相関は因果関係を意味しません。すべての隠し変数を公開すると、因果関係があります。


対応するベイジアンネットワークの矢印の方向が因果関係に関係する理由を理解するのに苦労しています。例えば、A-> BとB-> Aは、因果関係のために異なる方向を表しているが、これらの二つの構造のためのベイジアンネットワークは同等である
ヤロスラフBulatov

6
介入の面では同等ではありません。
ニールG

これらのベイジアンネットワークは、あなたはそれがあった1伝えることができない、与えられたデータは、そのうちの一つからサンプリング意味で等価である
ヤロスラフBulatov

4
えーと...私は長い目で実際の統計に精通していません...しかし、定義によって「すべての隠された変数を公開する」ことは不可能ではありませんか?「隠された」変数がなくなったとき、どうやって知るのですか?
クレイグウォーカー

4
@Craigそれがポイントです。不可能です。
ジャスティンL.

35

疫学の観点から見た因果関係に関するコメントを追加します。これらの議論のほとんどは、Prince et al。によるPractical Psychiatric Epidemiologyから取られています。(2003)。

因果関係、または因果関係の解釈は、疫学研究の中で最も困難な側面です。コホート研究と横断研究の両方が、例えば交絡効果につながる可能性があります。S.メナードの引用(縦断研究、Sage University Paper 76、1991)、HB Asher in Causal Modeling(Sage、1976)は、最初に満たすべき基準のセットを提案しました。

  • 問題の現象または変数は、たとえば実験群と対照群の違いまたは2つの変数間の非ゼロ相関によって示されるように、変化する必要があります。
  • 関係は、他の変数または変数セットに起因してはなりません。つまり、スプリアスであってはなりませんが、たとえば実験計画でのランダム化の成功によって示されるように、他の変数が制御されている場合でも持続する必要があります治療前の対照群)または他の変数が一定に保たれた2つの変数間の非ゼロ偏相関
  • 想定される原因は、影響の関連する変化よりも早く発生する原因の変化によって示されるように、想定される効果と時間的に先行するか、同時に発生する必要があります。

最初の2つの基準は、断面研究または時系列断面研究を使用して簡単に確認できますが、後者は、縦断データなしで時間的順序を想定できる生物学的または遺伝的特性を除き、縦断データでのみ評価できます。もちろん、非再帰的な因果関係の場合、状況はより複雑になります。

また、@ Jamesが引用したように、因果効果に関連する9つの異なる基準を含むHill(1965)によって公布されたアプローチを要約した次の図(前述の参考文献の第13章)も気に入っています。元の記事は、実際に「環境と病気:連想と因果関係?」というタイトルでした。(PDFバージョン)。

Hill1965

最後に、ロスマンの最も有名な本、Modern Epidemiology(1998、Lippincott Williams&Wilkins、第2版)の第2章では、統計的および哲学的観点から因果推論と因果推論に関する非常に完全な議論を提供します。

以下の参考文献(疫学のオンラインコースから大まかに取られた)も追加したいと思います。

最後に、このレビューは、因果モデリング、統計における因果推論に関するより大きな視点を提供します:概要(J Pearl、SS 2009(3))。


18

あなたの質問の中心にあるのは、「関係がいつ因果関係になるのか」という質問です。それは、因果関係を暗示する相関関係である必要はありません。

このトピックに関する良い本は、Johua AngristとJorn-Steffen PischkeによるMostly Harmless Econometricsと呼ばれています。それらは、研究中の「治療」を何らかの方法でランダム化できる実験的理想から始まり、その後、因果関係の影響を引き出すためにこのランダム化を生成する代替方法に移ります。これは、いわゆる自然実験の研究から始まります。

因果関係を特定するために使用されている自然実験の最初の例の1つは、1989年の「生涯収益とベトナム時代の抽選」に関するAngristの論文です。この論文は、兵役が生涯所得に及ぼす影響を推定しようとしています。因果効果を推定する際の重要な問題は、特定のタイプの人々が参加する可能性が高く、関係の測定にバイアスをかける可能性があることです。Angristは、ベトナムのドラフト宝くじによって作成された自然実験を使用して、男性グループに治療「軍事サービス」を効果的に「ランダムに割り当てる」。

それで、いつ因果関係があるのでしょうか?実験条件下。いつ親しくなりますか?自然実験中。「因果関係」に近づける他の手法もあります。つまり、単に統計的制御を使用するよりもはるかに優れています。それらには、回帰の不連続性、差異の違いなどが含まれます。


15

相関関係の欠如が因果関係の欠如の証拠として使用される場合、反対の場合にも問題があります。この問題は非線形性です。相関関係を見るとき、人々は通常、氷山の一角にすぎないピアソンをチェックします。


14

あなたの例は制御実験の例です。私が相関が原因を暗示できる場所について知っている唯一の他の文脈は自然実験のものです。

基本的に、自然な実験では、現実の世界で自然に起こる治療への回答者の割り当てを利用します。回答者の治療グループと対照グループへの割り当ては実験者によって制御されていないため、相関が因果関係を暗示する程度はおそらくある程度弱いでしょう。

制御/自然実験の詳細については、Wikiリンクを参照してください。


12

私の意見では、APA統計タスクフォースはそれを非常によく要約しました

''ランダム化されていない設計から因果関係を推測することはリスクの高い企業です。非ランダム化デザインを使用する研究者には、デザインに含まれる共変量の背後にある論理を説明し、結果を説明する可能性のあるライバル仮説を読者に警告するという追加の義務があります。ランダム化された実験においても、因果効果を治療条件のいずれかの側面に帰因させるには、追加の実験からの支援が必要です」-APAタスクフォース


11

オースティンブラッドフォードヒルir王立医学会会長(環境と病気:協会か因果関係?)は、2つの相関する変数または関連する変数の間に因果関係があるかどうかを判断するのに役立つ9つの基準を説明しています。

彼らです:

  1. 協会の強さ
  2. 一貫性:「それは、異なる場所、状況、時間で、異なる人によって繰り返し観察されましたか?」
  3. 特異性
  4. 一時性:「カートと馬はどちらですか?」-原因は結果に先行する必要があります
  5. 生物学的勾配(用量反応曲線)-影響の大きさは(疑わしい)因果変数の大きさにどのように依存していましたか?
  6. 妥当性-因果関係の可能性のある説明はありますか?
  7. 一貫性-因果関係は他の確立された事実と矛盾しますか?
  8. 実験-(疑われる)因果変数の実験的操作は(疑われる)従属変数に影響を与える
  9. 類推-過去に同様の因果関係に遭遇しましたか?

9

双子の例では、因果関係を示唆するのは相関関係だけではなく、関連する情報や事前知識もあります。

さらに1つの情報を追加するとします。勤勉な双子が統計試験の勉強に6時間費やしたが、不幸な誤りのために試験は歴史にあったと仮定します。この研究が優れたパフォーマンスの原因であると結論付けますか?

因果関係を決定することは哲学的な問題であり、科学的な問題と同じです。そのため、因果関係を議論するときにデビッドヒュームやカールポッパーなどの哲学者を呼び出す傾向があります。

驚くべきことではないが、医学は、微生物と病気との因果関係を確立するためのコッホの仮説など、発見的手法による因果関係の確立に大きな貢献をしている。これらは、病原体の遺伝子が病原体によって引き起こされる疾患に寄与する産物をコードすることを示すために必要な「分子コッホの仮説」に拡張されました。

残念ながら、私は新しいユーザー(本当ではない)であり、十分な「レピュテーションポイント」がないため、おそらくハイパーリンクを投稿できません。本当の理由はだれでも推測です。


9

相関だけでは因果関係を意味することはありません。とても簡単です。

しかし、2つの変数間の相関関係のみを持つことは非常にまれです。多くの場合、これらの変数とは何か、理論、または理論について何かを知っており、変数間に因果関係がある理由を示唆しています。そうでない場合、相関関係を確認する必要がありますか?(ただし、重要な結果を得るために大規模な相関行列をマイニングする人は、カジュアルな理論を持たないことがよくあります-さもなければ、なぜマイニングを悩ますのですか?

「ええ、しかしそれは単なる相関関係です。因果関係を意味するものではありません」という一般的な批判への回答:

  1. カジュアルな関係では、相関関係が必要です。相関関係を見つけることが繰り返し失敗することは、実に悪いニュースです。
  2. 相関関係を示しただけではありません。
  3. 次に、相関関係を説明する可能な原因メカニズムを説明します...

2
あなたのポイントへの反例#1:混systemとしたシステムでは、明らかな相関関係のない因果関係があるかもしれません。
mkt

8

因果関係のいくつかの定義に役立つ十分な条件:

相関変数の1つを制御でき(その値を直接設定できる)、相関がまだ存在する場合、因果関係を主張できます。


2
「変数の値を直接設定する」というパールの言葉、つまり介入を使用することもできます。
ニールG

8
  1. ほぼ常に無作為化試験で
  2. 誰かがすべてのconfoudersを測定するときほとんどの場合観察研究で(ほとんど決して)
  3. 時々、誰かがいくつかの共同創立者を測定するとき(IC *パールの本因果関係のDAG発見のアルゴリズム)
  4. 2つ以上の変数を持つ非ガウス線形モデルで、関係の尺度として相関を使用しない(LiNGAM

ほとんどの発見アルゴリズムはTetrad IVに実装されています


6

関連する質問は、どのような条件下でデータから因果関係を確実に抽出できるかです。

2008年のNIPS ワークショップは、その質問に経験的に対処しようとします。タスクの1つは、1つの変数が別の変数を引き起こすことがわかっている変数のペアの観察から因果関係の方向を推測することであり、最良の方法は80%の時間で因果方向を正しく抽出することができました。


3

ほぼ確実にうまく設計された実験で。(もちろん、そのような接続を引き出すように設計されています。)


3

因子Aが現象Bの原因であると考えると、それを変化させてBが変化するかどうかを確認します。Bが変化せず、他のすべてが変更されていないと仮定できる場合、AがBの原因ではないという強力な証拠。Bが変化する場合、Aの変化が原因である可能性があるため、Aが原因であると結論付けることはできません実際の因果関係Cの変化により、Bが変化しました。


Aを変えることができますか?
RockScience

2

実証的なパラダイムを議論するときに、ここで「証明」が使用されていることに気付きました。そのようなことはない。まず、仮説があります。ここでは、アイデアが進歩しています。次に、「制御された条件」[注a]の下でテストが行​​われ、「十分な」反論の欠如に遭遇した場合、仮説の段階に進みます。...期間。1)上記イベントの発生ごとになんとかして[注b]、そしてもちろん2)因果関係を確立できない限り、証拠はありません。1)無限の宇宙ではありえない[本質的に無限は証明できないことに注意]。注A; 完全に制御された条件下では実験は行われず、条件がより制御されればされるほど、明らかに無限の因果関係を持つ外宇宙との類似性は低くなります。注b; 「イベント」と完全に説明している必要があります。これはおそらく完全に正しい言語を意味していると思われますが、おそらく人間の言語ではありません。最後の注意として、すべての因果関係はおそらく最初のイベントに戻ります。さて、理論を持った全員と話をしてください。はい、正式に非公式に勉強しました。最後に; いいえ、近接性は因果関係や一時的な相関関係以外のことを意味しません。


1

XY

Y=bX+u

bXYE(b)=BXuE(u|X)=0u YXY

不偏であることは推定量の望ましい特性ですが、推定量を効率的(低分散)で一貫性のあるもの(確率が真の値になる傾向)にすることも必要です。Gauss-Markovの仮定を参照してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.