因果関係なしで相関が役立つのはいつですか?


27

多くの統計学者の言うペットは「相関は因果関係を意味しない」です。これは確かに真実ですが、ここで暗示されていると思われることの1つは、相関にはほとんどまたはまったく価値がないことです。これは本当ですか?2つの変数が相関していることを知ることは無意味ですか?

それが想像できない。私は予測分析に恐ろしくは慣れていませんXが、の予測子である場合、因果関係に関係なく、YY基づいての将来の値を予測するのに役立つようですX

相関の値を見るのは間違っていますか?そうでない場合、統計学者またはデータ科学者はどのような状況で因果関係なく相関を使用できますか?


5
私の意見では、「因果関係は相関を意味しない」というフレーズは、統計が常に信頼されるべきではないことを意味するために誤用されることがよくあります(本当ですが、必ずしも因果関係がないためではありません)。予測分析が間違っている理由に関して、人々がこのフレーズを落とすのを見ると、私はとても腹を立てます。たとえば、facebook.com / notes / mike-develin / debunking-princeton /…は、ひどい分析とひどい分析のひどいデバンキングの両方の素晴らしい例です。
クリフAB

10
たとえば、特定の都市での生活が早期死亡と相関していることがわかったとします。その都市に住んでいる早期に死に至り、人々がその都市から出て行っても長生きできると結論付けることはできません。(たぶん、なんらかの理由で都市は病弱な人々にとって魅力的です。)しかし、あなたがアクチュアリーであるなら、あなたはその都市のメンバーにより高い生命保険料を請求したいことで完全に正当化されるでしょう。君は。
ネイト・エルドリッジ

2
イングランド南部の@NateEldredgeでさらに多くの人が亡くなっています。人々がそこで引退するからです。
TRiG

1
不在相関のは間違いなく、より多くの意味を運びます。
ラファエル

必須のxkcdリファレンス:xkcd.com/552
vsz

回答:


32

相関(または他の関連性の尺度)は、因果関係に関係なく予測に役立ちます。2つの変数間の明確で安定した関連性を測定するとします。これは、ある変数のレベルを知ることで、関心のある別の変数に関する情報も得られることを意味します。これを使用して、ある変数を他の変数の関数として予測し、最も重要なことに、その予測に基づいて何らかのアクションを実行できます。行動を起こすには、自動化された推奨事項を作成するときや医療介入を採用するときなど、1つ以上の変数を変更することが含まれます。もちろん、2つの変数間の直接的または間接的な関係についてより多くの洞察があれば、より良い予測を行い、より効果的に行動することができます。この洞察には、空間的および時間的変数を含む他の変数が関係する場合があります。


4
相関は予測に必ずしも役立つとは限りません。逆因果の場合、常に制御できない重要な時間的側面があります。私たちは常にアルツハイマー病でこれに直面しています。私たちは常に識別しようとして壁に向かって私たちの頭を打っている:AD影響を受けた脳内我々は見つけるバイオマーカーである原因となる疾患または起因する疾患は?
AdamO

1
@AdamO私の答えは、最後の1つか2つの文でそのベースをカバーしていると思うので、私はあなたに同意しません。
ブラッシュ平衡

1
因果関係の問題は、予測モデルを解釈しようとしている場合にのみ実際に発生します。(もちろん、これは私たちがしばしば科学に興味を持っていることです)。バイオマーカーAが非常に優れた予測因子であることがわかった場合、これが病気の原因でもあると主張することは非常に魅力的です-そして、コメントで述べたように、間違った結論に達するのは非常に簡単です。予測だけをしたい場合、例えば患者が病気にかかっているかどうかを言う場合、相関関係に問題はありません。
セル

1
これは真実ではありませんが、これはほんの一例です。予測に基づいて行動する場合、変数を変更し、ターゲットも変更することを期待しますが、実際には直接的なリンクが存在しないか、因果関係が逆になる場合、間違ったアクションを実行します。「しかし、この例ではモデルを解釈している」と言う前に、「予測を目的としたモデルからでもどのようなシナリオで推論を引き出さないのか」と言います。回答:モデルが示す因果関係をあまり信頼していない場合。
ブラッシュ平衡

1
@BrashEquilibrium:予測に基づいて行動する方法はたくさんありますが、予測を取得するために使用される変数を変更する必要はありません。あなたの店がウールミトンを買いだめすべきかどうか知りたいですか?あなたが最近販売しているアイスクリームの量を知ることは(もちろん、より直接的なデータのソースが存在しないという仮定で)良い予測をすることができます。
イルマリカロネン

17

ここにはすでに多くの良い点があります。「Xの予測子である場合、因果関係に関係なく、YY基づいての将来の値を予測するのに役立つと思われる」という主張をX少し解きましょう。あなたは正しいです:あなたが望むすべてが未知のものを予測できるようにすることである場合Y既知のX値と既知の安定した関係から値、その関係の因果関係は無関係です。それを考慮してください:

  • 原因から効果を予測できます。これは直感的で議論の余地のないものです。
  • 効果の知識から原因を予測することもできます。肺がんにかかった人の中には喫煙したことがない人もいます。その結果、誰かが肺がんを持っていることを知っている場合、喫煙が原因であり、がんが効果であるという事実にもかかわらず、彼らが喫煙者である/喫煙者であると確信を持って予測できます。庭の草が濡れていて、スプリンクラーが走っていない場合、雨が原因で濡れた草が単なる効果であるにもかかわらず、雨が降ったと予測できます。等。
  • 同じ原因の既知の効果から未知の効果を予測することもできます。たとえば、ビリーとボビーが同じ双子で、ビリーに会ったことがないが、ボビーが5 '10'(178 cm)であることを知っている場合、ビリーも178 cmであると確信できます。ビリーの身長はボビーの身長を引き起こさないし、ボビーの身長はビリーの身長を引き起こさない。

7
カテゴリに名前を付けるだけです:3種類の予測は、(順番に)控除duction、および帰納と呼ばれます。
ニールG

12

彼らは相関の重要性をだましていない。相関関係を因果関係として解釈する傾向があるだけです。

授乳は完璧な例です。母親はほとんどの場合、母乳育児に関する(観察研究の)調査結果を、実際に母乳で育てるべきかどうかの提案として解釈します。確かに、母乳で育てられた乳児は、縦の母性および父性の年齢、社会経済的状態などを制御した後でも、より健康な大人になる傾向があるのは事実です。食欲調節の初期の発達において部分的に役割を果たす。関係は非常に複雑であり、観察された違いの根底にある可能性のある多くの媒介因子を容易に推測できます。

多くの研究は、何が起こっているかについてのより深い理解を保証するために協会に注目しています。相関関係は役に立たないわけではありません。因果関係のいくつかのステップに過ぎません。専門家でない人からの誤解を防ぐために調査結果を報告する方法に留意する必要があります。


9

相関関係が役立つことは確かです。因果モデルが関連モデルよりも優れている理由は、パールが言うように、介入モデルがオラクルだからです。言い換えれば、仮説的に推論することができます。因果モデルは、「Xを実現する場合、Yに何が起こるか」という質問に答えます。

しかし、必ずしも仮説的に推論する必要はありません。お使いのモデルがされている場合のみ、「私はXを観察する場合、私はYについて何を知っていますか?」などの質問に答えるために使用することになるだろう、それから連想モデルは、すべてあなたが必要とします。


3
オラクルズ・フォー・インターベンションズはバンドにとって良い名前です。
マルヴォリオ

@Malvolio:笑、それは因果モデルを記述するための忘れられないほど簡潔な方法です。私はそのフレーズが本当に好きです。
ニールG

4

相関が予測に役立つことは正しいです。また、調査中のシステムの理解を深めるためにも役立ちます。

因果メカニズムについての知識が必要な1つのケースは、ターゲット分布が操作されている場合です(たとえば、特定の値をとるように一部の変数が「強制」されている)。相関関係に基づいたモデルのパフォーマンスは低下しますが、原因情報を使用したモデルのパフォーマンスははるかに優れています。


2

相関関係は、因果関係を説明する基礎となるモデルがある場合に便利なツールです。

たとえば、オブジェクトに力を加えるとその動きに影響することがわかっている場合、力と速度、力と加速度の相関を測定できます。(加速度との)より強い相関関係は、それ自体で説明されます。

観察研究では、相関関係によって特定の一般的なパターン(母乳育児とその後の健康)を明らかにすることができ、因果関係を確認または拒否できる適切な実験計画により、さらなる科学的調査の根拠となる可能性があります(たとえば、母乳育児が原因である可能性があります)特定の文化的枠組みの結果)。

したがって、相関関係は有用ですが、決定的なものになることはめったにありません。


2

あなたが述べたように、相関関係だけでも、主に予測に多くの有用性があります。

ABAB

たとえば、高齢者でのコーヒーの大量使用がより健康な心臓血管系と相関していることを示すこれらの研究はすべて、私の心では、重いコーヒー習慣を正当化したい人々によって動機付けられていることは間違いありません。しかし、コーヒーを飲むことは因果関係ではなく健康な心とのみ相関しているということは、関心のある本当の質問に答えることは何もありません。コーヒーをもっと飲むか、または減らすと健康になりますか?非常に興味深い結果を見つけるのは非常にイライラする可能性があります(コーヒーはより健康な心にリンクしています!)が、その情報を使用して意思決定を行うことはできません(まだ健康的にコーヒーを飲むべきかどうかはわかりません)相関関係を因果関係として解釈する誘惑。

多分あなたが気にするのはギャンブルだけです(つまり、予測したいが影響はしたくない)。


2

相関関係には価値がありますが、因果関係を結論付けるためにより多くの証拠を調べる必要があります。

何年も前に、「コーヒーは癌を引き起こす」という結果をもたらす研究がありました。ニュースでこれを聞いてすぐに、妻に「誤った相関関係」と言った。私は正しかったことがわかりました。1日2〜3杯のコーヒー人口は、コーヒーを飲まない人よりも喫煙率が高かった。データコレクターはこれを理解すると、結果を撤回しました。

住宅ブームとバストの前の別の興味深い研究は、住宅ローンの処理に関して人種差別を示しました。主張は、黒人の申請者が白人よりも高い割合で拒否されたということでした。しかし、別の調査ではデフォルト率を調査しました。黒人の住宅所有者は、白人と同じ割合でデフォルトをしていました。黒のアプリケーションがより高い基準に保持されていた場合、デフォルト率は実際にははるかに低くなります。注:この逸話は、著者Thomas Sowellの著書The Housing Boom and Bustで共有されています

データマイニングでは、高い相関関係を示す2つのデータセットを簡単に生成できますが、関連性のないイベントについては可能です。最後に、あなたのやり方で送られてきた研究を非常に批判的な目で見るのが最善です。誤った相関関係を見つけることは必ずしも容易ではありません。それは才能の獲得です。


この答えを読んで楽しかったです。しかし、「2つの変数が相関していることを知ることは役に立たないのですか?...統計学者またはデータ科学者は因果関係なしで相関を使用するかもしれません」という質問の逆に対処するようです。
whuber

1
「黒人の住宅所有者は白人と同じ割合でデフォルトをしていました。黒のアプリケーションがより高い基準に保たれている場合、実際にはデフォルトの割合ははるかに低くなります。」結論に飛びついています。それはまさにこの問題です。黒人の申請者は統計的には白人の申請者とは異なります。また、住宅ローンのデフォルトを受け入れている可能性が高いグループにさらに多くの黒人がいる場合、デフォルト率が同じ黒の申請者は差別を示します。交絡効果の分離は困難です。
prosfilaes

私が述べたように、逸話は有名な黒人学者から来ました。そして、私が参照した本で議論する段落よりもはるかに多くの時間がかかりました。
JTP-モニカに謝罪

1

相関は観測可能な現象です。測定できます。これらの測定値に基づいて行動できます。単独で、それは便利です。

ただし、相関関係があるだけであれば、変更が実際に効果を発揮するという保証はありません(iPhoneの増加を海外の奴隷制度などに結び付けた有名なグラフを参照)。そこには相関関係があることが示されているだけで、環境を微調整する(行動する)と、その相関関係がまだ存在する可能性があります。

ただし、これは非常に微妙なアプローチです。多くのシナリオでは、より微妙なツールである因果関係が必要です。因果関係は、何らかの方法で行動することで環境を微調整する場合、相関関係が依然として存在することを期待するという主張と組み合わされた相関関係です。これにより、20または50の因果イベントを連続して連鎖させて有用な結果を特定するなど、長期計画を立てることができます。多くの場合、20または50の相関でこれを行うと、非常にあいまいで不明瞭な結果が残ります。

それらが過去にどのように有用であったかの例として、西洋科学対伝統的な中国医学(TCM)を考慮してください。西洋科学は主に「理論を開発し、理論を実証できるテストを分離し、テストを実行し、結果を文書化する」ことに焦点を当てています。これは、「理論を発展させる」ことから始まります。これは、因果関係に強く結びついています。TCMは、「有用な結果を提供できるテストを考案し、テストを実行し、回答の相関を特定する」ことから始めて、それを回しました。焦点は相関関係にあります。

現在、西洋人はほぼ完全に因果関係の観点で考えることを好む傾向があるため、相関関係を研究する価値はスパイするのがより困難です。しかし、それは私たちの生活の隅々に潜んでいます。そして、西洋科学においてさえ、相関は探索する価値のある理論を識別するための重要なツールであることを決して忘れないでください!

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.