因果関係は相関関係を意味しますか?


118

相関関係には多くの説明があるため、相関関係は因果関係を意味するものではありません。しかし、因果関係は相関関係を意味しますか?直観的に、因果関係の存在は必然的に何らかの相関関係があることを意味すると思います。しかし、私の直観は常に統計でうまく機能していません。因果関係は相関関係を意味しますか?


5
問題は、辞書で「暗黙」を検索すると、「提案」と「必要」の両方が表示されることです。
-rolando2

6
相関は因果関係を意味するものではありませんが、眉を暗示的に振り回し、「あそこを見ろ」と口を開きながらふりをします。xkcd.com/552
jchristie

1
暗示という言葉の使用が示すように、質問自体は特定の事実に基づく答えを探しているようには見えません。上記の参照は、おそらく究極のようなものです。または、おそらくもっと似ていますが、私はそれを証明できません。
jchristie

回答:


96

上記の回答の多くが述べているように、因果関係は線形相関を意味するものではありません。相関の概念の多くは、線形統計に大きく依存するフィールドに由来するため、通常、相関は線形相関に等しいと見なされます。Wikipediaの記事は、私は本当にこの画像のように、このために大丈夫ソースです。

相関の例

一番下の行のいくつかの図、たとえば4番目の例の放物線のような形を見てください。これは、@ StasKの回答で発生することです(少しノイズが追加されています)。YはXによって完全に引き起こされる可能性がありますが、数値の関係が線形で対称的でない場合、相関は0のままです。

あなたが探している言葉は相互情報です:これは一種の相関の一般的な非線形バージョンです。その場合、あなたの声明は真実です:因果関係は高い相互情報を意味します


3
通常、常にではありませんが、高い相互情報が因果関係を伴うことは事実です。@gungの回答を参照してください。「原因が、まったく逆の効果を持つ別の原因変数と完全に相関している場合」。
ニールG

5
いつものように私にはあまり意味がありませんお互いを相殺する逆の効果を持つ2つの原因の引数原因。何かを引き起こしているユニコーンがあり、グレムリンがその努力を完全にキャンセルしていることはいつでも推測できます。馬鹿げているのでこれは避けます。しかし、あなたの主張を誤解しているのかもしれません。
アルテムKaznatcheev

11
彼の例は、必要以上に極端です。ブール変数、およびCを使用して、AおよびBCの原因となり、C = A + B(mod 2)になる可能性があります。そして、BACの知識がない場合、相互情報はありません。 Bは未発見の交絡因子です。非常に一般的なものですが、「グレムリン」と呼んでいます。A,BCABCC=A+BBACB
ニールG

2
@NielG最初の文には同意しますが、2番目の文には同意しません。AとBがCを引き起こすからといって、AがCを引き起こし、BがCを引き起こすという意味ではありません。
アルテムKaznatcheev

4
Aは、それにもかかわらず、Cの原因であることを理由にAはまだそうC.を変更します変更されているので、Cは、我々はB.を観察していない場合でも、に依存している
ニール・G

41

厳密な答えは「いいえ、因果関係は必ずしも相関を意味するものではありません」です。

検討及びY = X 2χ 2 1。因果関係が強くなることはありません。XYを決定します。ただし、XYの相関は0です。証明:これらの変数の(結合)モーメントは次のとおりです。E [ X ] = 0 ; E [ Y ] = E [ X 2 ] = 1 ; CXN(0,1)Y=X2χ12XYXYE[X]=0E[Y]=E[X2]=1

Cov[X,Y]=E[(X0)(Y1)]=E[XY]E[X]1=E[X3]E[X]=0
奇数モーメントがすべてゼロに等しいという標準正規分布のプロパティを使用します(たとえば、モーメント生成関数から簡単に導出できます)。したがって、相関はゼロに等しくなります。

コメントのいくつかに対処するため:この引数が機能する唯一の理由は、の分布がゼロを中心とし、0を中心に対称であるためです。場所N 0 1 、例えば、上に均一な- 10 10 やラプラス〜のEXP - | X |。単純化しすぎ引数は、すべての正の値のためということであるX、の均等そうな負の値が存在するXXN(0,1)(10,10)exp(|x|)XXXXYXN(3,1)E[X]=3E[Y]=E[X2]=10E[X3]=36Cov[X,Y]=E[XY]E[X]E[Y]=3630=60XXXYχ2; Wikipediaページから分散を引き出して、関心がある場合は相関を計算できます。)


2
@DQdlM:標準ランダム変数は、密度の均一性のために、消失する奇数の中心モーメントを持ちます。Matthew:StasKが示したように、答えはいいえです。相関関係が唯一の依存関係ではないからです。
エマー

3
XN(3,1)

3
PSこの回答を投稿できてとてもうれしいです。この答えがなければ、質問がこれほど長く続いたとは信じ難い。これは、この質問を見たときに頭に浮かんだ正確な例でしたが、書く時間はありませんでした。あなた時間を取ってくれてうれしいです。乾杯。
枢機

3
@cardinal:ええ、私たちは皆、大学院でこれらの種類の単純な反例を学んだと思います...そして、はい、共分散の導出から、ゼロになるために必要なのは1番目と3番目の瞬間だけです。3次モーメントがゼロの非対称分布の自明でない例がある場合(5または6ポイントを超える微調整された確率質量はカウントされません)、私はそれを見て非常に興味があります。
StasK

3
XYfY=f(X)

31

基本的にははい。

原因を超えて相関関係について他の説明がある可能性があるため、相関関係は因果関係を意味しません。しかし、AがBの原因であるためには、何らかの方法で関連付けられている必要があります。つまり、それらの間に相関関係があります-ただし、その相関関係は必ずしも線形である必要はありません。

一部のコメンターが示唆したように、相関よりも「依存」または「関連」などの用語を使用する方が適切である可能性があります。コメントで述べたように、単純な線形相関をはるかに超えた分析に応答して「相関は因果関係を意味するものではない」ということを見てきたので、言い方をするために、本質的に「相関」を任意のAとBの間の関連付け


16
私は線形相関のために単語相関を予約する傾向があり、線形相関がある場合とない場合がある非線形関係に依存関係を使用します。
Memming

4
@Memming私もそう思いますが、人々は「相関関係は因果関係を暗示していない」という事実を除けば、かなり複雑な非線形の関連性です。
フォマイト

Memmingは正しい。ピアソン相関を意味しない場合は、相関を定義する必要があります。
ニールG

1
@NeilGまたは、そのことについては、1つの変数または他の変数を変換することにより、線形のピアソン相関を取得できる場合があります。問題は、格言自体が単純化されすぎていることです。
Fomite

1
@EpiGrad:両方の良い点。一般的な言い方をすれば、相関関係はAがより多く、Bがより多いということです。相関関係の幅広い定義を明確にすることで、答えが得られると思います。
ニールG

23

@EpiGradの答えに追加します。多くの人にとって、「相関」は「線形相関」を意味すると思います。そして、非線形相関の概念は直感的ではないかもしれません。

だから、私は「いいえ、彼らがする必要はありませんと言うだろう相関が、彼らはする必要があります関連します」。実体については同意しますが、実体を伝える最善の方法については反対します。

このような因果関係の1つの例(少なくとも人々はそれが因果関係だと考えています)は、電話に応答する可能性と収入の間です。収入スペクトルの両端の人々は、中央の人々よりも電話に応答する可能性が低いことが知られています。因果パターンは貧しい人(例:集金者を避ける)と金持ち(例:寄付を求める人を避ける)では異なると考えられています。


21

XY

次の因果モデルを検討してください。

XYU

XUY

今、みましょう:

Xbernoulli(0.5)Ubernoulli(0.5)Y=1XU+2XU

UP(Y|X)=P(Y)XYYX

XUYXUXYUY {X,U}YXYXYXYXYU

要するに、(i)因果関係依存を示唆している。ただし、(ii)依存性は機能的/構造的依存性であり、考えている特定の統計的依存性に変換される場合と変換されない場合があります。


カルロス、因果モデルに含まれる変数の完全なセットを知っている場合、この問題(統計的不可視性)は消えると言うのは正しいですか?
マルコウィッツ

@markowitzでは、すべてを決定論的なレベルで観察する必要があるため、あまり現実的なシナリオではありません。
カルロスチネリ

あなたの答えを「はい」と解釈します。あなたは正しい、私が想定した状況は非現実的です。私はそれを知っています。ただし、質問はあなたが説明したロジックについてのみ関連しており、最終的なものはそれを把握することでした。私の信念は「因果関係は統計的関連を暗示している」ようなものであり、このページの他の回答はこのように聞こえます。やはりあなたの例は少し非現実的ですが、この理由のために面白くないわけではありません。また、一般的に、統計的関連のない因果関係はわずかに非現実的ですが、理論的には興味深いようです。
マルコウィッツ

1
@markowitzは、モデルがグラフに忠実でない場合に「統計的不可視性」が発生します。正確なキャンセルの場合、これはパラメータ化の特定の選択に依存するため、一部の人々はそれが実際にありそうもないと主張します。ただし、近くのキャンセルはパラメーターの近傍に依存するため、もっともらしいかもしれません。したがって、すべてはコンテキストに依存します。ここでのポイントは、因果関係は論理的に因果関係自体を意味しないため、因果的仮定を明確にする必要があるということだけです-追加の仮定が必要です。
カルロスチネリ

13

何も変化がない場合を除き、原因と結果を相関されるすべてで発生し、原因の大きさと変化がない中で、すべての因果力に。他の唯一の可能性は、原因がまったく逆の効果で別の原因変数と完全に相関している場合です。基本的に、これらは思考実験条件です。現実の世界では、因果関係は何らかの形で依存関係を意味します(ただし、線形相関ではない場合があります)。


3
@NeilG、私はイタリック体に夢中になりました。
GUNG

1
多くのゲーム理論モデルなど、いくつかの理論は実際にこれを暗示しています。あなたがすることはできませんいくつかの実証的な状況を見分けることが:-)たとして、実際に「GUNG-斜体で」1が存在することになるが、二つのレベルで進化の選択圧が異なる方向にポイントしたときに「ニュートラル」なしの遺伝子変動シナリオを含める(違いを。
共役前

1
最初の例外は好きですが、2番目の例外は好きではありません。スイッチを切り替えるとライトが点灯すると思うのが好きですが、停電中にスイッチを切り替えるだけの場合は何も起こりません。おそらく、実際には因果関係はありませんでした。
エモリー

1
@ naught101、あなたはこのページの他の場所で議論されている良い点を提起します。回答を編集しました。しかし、私が人々と仕事をしたとき、私が彼らに言ったとしても、彼らは必ずしも線形であるという強い概念を持っているとは思いません。彼らはこれらの用語には入れませんが、ほとんどの人は「相関」を「機能」に近いものとして理解していると思います。それにもかかわらず、用語の使用については明確にすべきであり、最初からそうであるべきです。
GUNG

2
@emory:点灯する光の原因は、実際には電気回路の閉鎖です(機能するグリッドを含む環境条件でのスイッチのフリックによって引き起こされます)。停電中にスイッチをフリックしても、他の場所で壊れているため、回路は閉じられません。ある意味で、ブラックアウトは、gungが話していた「反対の」効果です(つまり、ライトがオンで、ブラックアウトがオフになります)。また、無効化効果と考えることもできます。
naught101

2

ここには素晴らしい答えがあります。Artem KaznatcheevFomite、およびPeter Flomは、因果関係は通常、線形相関ではなく依存関係を意味すると指摘しています。Carlos Cinelliは、生成関数がどのように設定されているかにより、依存関係がない例を示します。

この依存関係が実際にどのように消えるのかについて、あなたがよく使うかもしれない種類のデータセットにポイントを加えたいと思います。カルロスの例のような状況は、単なる「思考実験条件」に限定されません。

自己調整プロセスでは依存関係がなくなります。たとえば、恒常性は、体温が室温に依存しないことを保証します。外部の熱は体温に直接影響しますが、体温を安定に保つ体の冷却システム(発汗など)にも影響します。非常に速い間隔で温度をサンプリングし、非常に正確な測定値を使用すると、因果依存性を観察する機会がありますが、通常のサンプリングレートでは、体温と外気温は独立して表示されます。

自己調節プロセスは、生物系では一般的です。それらは進化によって生み出されます。体温の調節に失敗した哺乳類は、自然selectionによって除去されます。生物学的データを扱う研究者は、データセット内で因果依存がなくなる可能性があることに注意する必要があります。


-3

相関のない原因はrngになりませんか?

受け入れられた答えが示唆するように、「相関」という言葉の信じられないほど限られた解釈を使用していない限り、それはばかげた質問です-あるものが別のものを「引き起こす」場合、それは定義によって何らかの方法で影響を受けます人口の増加、または単に強度。

右?

もう一度、あなたはもっと何か、何か他のものによって影響されているものの可視性について議論しているかもしれません。

ええ、私は簡単な答えは「はい、エントロピーを作成できない限り」だと思います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.