教育の例:相関は因果関係を意味しない


74

「相関は因果関係を意味するものではありません」という古いことわざがあります。私が教えるとき、この点を説明するために次の標準的な例を使用する傾向があります。

  1. デンマークのコウノトリの数と出生率。
  2. アメリカの司祭の数とアルコール依存症;
  3. 20世紀の初めには、「ラジオの数」と「非常識な亡命者の数」との間に強い相関関係があったことが注目されました。
  4. そして私のお気に入り:海賊は地球温暖化を引き起こします。

しかし、私はこれらの例については何も言及していませんが、面白い一方で、明らかに間違っています。

誰か他の良い例はありますか?


2
いくつかの優れた例については、フリーコノミクスをめくってください。彼らの参考文献は参照でぎっしり詰まっています。
スティーブンターナー


5
その海賊/地球温暖化チャートは陰謀理論家によって明らかに作られています-誰もが海賊がほぼ完全に一掃されるにつれて温度の最近の急激な上昇を示すことを避けるために不均等な時間間隔を意図的にプロットしているのを見ることができます。気温が上昇するとラム酒が蒸発し、海賊はその条件を生き延びることができないことを私たちは皆知っています。;-)
AdamV

4
WTFはその海賊グラフのx軸に対応していますか?
-naught101

1
または、Google Correlateに入れたものはほとんど何でもあります。
共役

回答:


39

「因果関係」は非対称関係(XはYがYとXを異ならせる)であるのに対し、「相関する」は対称関係であると説明することが役立つ場合があります。

例えば、ホームレス人口と犯罪率は、同じ場所で両方とも高いか低い傾向があるという点で相関しているかもしれません。ホームレス人口が犯罪率と相関している、または犯罪率がホームレス人口と相関していると言うことも同様に有効です。犯罪がホームレスを引き起こしている、またはホームレス人口が犯罪を引き起こしていると言うことは、異なる声明です。そして、相関関係は、どちらかが真実であることを意味するものではありません。たとえば、根本的な原因は、薬物乱用や失業などの3番目の変数である可能性があります。

統計の数学は根本的な原因を特定するのが得意ではありません。そのためには他の何らかの判断が必要です。


3
私たちが観察できるのは相関関係だけなので、判断は良い言葉です。実験および/または巧妙な統計ができることは、効果を引き起こす可能性のあるものについてのいくつかの代替説明を除外することです。
ジョナス

対称/非対称関係についての非常に良いコメント。また、地球温暖化が著作権侵害を増加させると主張するかもしれません。
アンドレホルツナー

27

私のお気に入り:

1)より多くの消防士が火に送られるほど、より多くの損害が発生します。

2)個別指導を受けた子どもは、個別指導を受けなかった子どもよりも成績が悪くなります

そして(これは私の一番上のものです)

3)小学校の初期には、占星術の兆候はIQと相関していますが、この相関関係は年齢とともに弱まり、成人になると消失します。


2
(@xmjxは昨年最初の例を提供しました。)私は占星術の例が大好きです。
whuber

占星術のサインでサンプルを説明してもらえますか?
ユージンD.グベンコフ

2
気にしないで、私はそれを得た。それは、年の初めに生まれた人と年末に生まれた人の年齢差に関係しています。いいね
ユージンD.グベンコフ

24

私はいつもこれが好きでした:

レモン対死

ソース:http : //pubs.acs.org/doi/abs/10.1021/ci700332k


1
いいですね、でもそこで因果関係の結論を出そうとしている人は誰もいません。それともメキシコのレモントラック運転手は、国境を越えたら危険なことで有名ですか?
AdamV

2
明らかに、米国におけるレモン法のof延の予期せぬ副作用。例:en.wikipedia.org/wiki/Lemon_law
Thylacoleo

11
私の同僚は...ポスト2000の期間中、このため、データを見て、関係は「アウト・オブ・サンプル」もっと不穏で、かなりよく開催されたことが判明
shabbychef


単純な合理化は、両方が時間とともに減少することです。2000年以降のデータはそれをサポートしていますか?PS、Box Hunter、Hunter(下記参照)は、コウノトリの例を同じように説明しています。どちらも問題の期間にわたって時間とともに増加します。
エミール・フリードマン14

23
  1. 相関関係で十分な場合もあります。たとえば、自動車保険では、男性ドライバーはより多くの事故と相関関係があるため、保険会社はより多くの事故を請求します。これを因果関係について実際にテストする方法はありません。ドライバーの性別を実験的に変更することはできません。Googleは因果関係を気にせずに数千億ドルを稼いでいます。

  2. 原因を見つけるには、通常、観測データではなく実験データが必要です。しかし、経済学では、CEOが突然死んで株価が上昇した場合など、因果関係をテストするために、システムに観察された「ショック」を使用することがよくあります。

  3. 相関は必要ですが、因果関係の十分な条件ではありません。原因を示すには反事実が必要です。


1
私はあなたが与える最初の例が好きです。それは確かに学生に話させる;)
csgillespie

1
Steve Steinbergのブログで興味深い議論があります:blog.steinberg.org/?p=11で、1の意味と、弱いAIの観点からどこにつながるかについて説明しています。
アモス

誰かが最後の文を少し拡張できますか?
-naught101

4
X(1,1)Y(0,1)Y=1X2XsXY

18

使用したい例がいくつかあります。

  1. 80年代にニューヨーク市で犯罪の原因を調査したとき、彼らが都市をきれいにしようとしていたとき、学者は、犯された重大な犯罪の量と露天商人によって販売されたアイスクリームの量との間に強い相関関係を発見しました(原因はどれですか、結果はどれですか?)明らかに、両方を引き起こす観測されていない変数がありました。夏は、犯罪が最も多く、アイスクリームが最も多く売られる時期です。

  2. 手のひらのサイズは、あなたがどれだけ長く生きるかと負の相関があります(本当に!)。実際、女性は手のひらが小さく、長生きする傾向があります。

  3. [私のお気に入り]数年前に、人が飲むソーダの量が肥満の可能性と正の相関があることを発見した研究について聞いたことがあります。(私は自分自身に言った-それは人々が砂糖の入ったソーダを飲んで空のカロリーをすべて手に入れたことによるものだから意味がある)ほとんどすべての相関関係は、ダイエットソフトドリンクの消費の増加によるものでした。(それは私の理論を吹き飛ばしました!)それで、因果関係はどちらの方法ですか?ダイエット清涼飲料は体重を増加させますか、または体重増加はダイエット清涼飲料の消費を増加させますか?(あなたはそれが後者であると結論する前に、ラットを用いた制御された実験は、人工甘味料とヨーグルトを与えたグループは、通常のヨーグルトを供給したグループよりも多くの体重が増え示した研究を参照してください。)の2つの参照:もっとダイエットソーダを飲みます、体重を増やしますか?; 肥満に関連するダイエッ​​トソーダ。彼らはまだこれを整理しようとしていると思います。


4
最後のものは、あなたが提示するよりもやや複雑ですが、ソーダ/ダイエットソーダと肥満の間に見られる観察上の関連性の多くは、批判的な目で見る必要があることに同意します。理論的には、偽の砂糖/脂肪代替品は単純なカロリー摂取量を超えて他の生理学的効果があると仮定しています。たとえば、ラットと合成脂肪に関するこの実験を参照してください(Freakonomicsブログから取得)。
アンディW

18

ある国が獲得したノーベル賞の数(人口の調整)は、一人当たりのチョコレート消費量とよく相関しています。(ニューイングランド医学ジャーナル

ここに画像の説明を入力してください


2
1彼らはこれを公開したときに、私はNEJMと非常に失望した
MattBagg

5
スウェーデンに近いこととも非常によく相関しているようです。
naught10112

2
チョコレート消費量(1人あたり)も、連続殺人犯の1人あたり数と大きく相関しています。replicatedtypo.com/...
ハーヴェイMotulsky

2
私は(漠然と)知っている3人のノーベル賞受賞者に尋ねましたが、3人全員が同僚のほとんどよりもずっと多くのチョコレートを食べたと言いました。もちろん、これらの答えはNEJMの論文を読んだ後に来ました!
ハーベイモトゥルスキー

4
@MattBaggこれは「Occasional Notes」として公開されており、明らかに真剣に受け止められていないことは明らかです。
パスカル14

13

これは多重比較の問題をより具体的に示したものですが、因果関係の誤った原因の良い例でもあります。

ラグビー(ウェールズの宗教)とそのカトリック教会への影響:教皇ベネディクト16世は心配するべきですか?

「ウェールズがラグビーグランドスラムで勝利するたびに、ウェールズが本当に良かった1978年と2人の教皇が死んだことを除いて、教皇は死にます。」


9

このポストホックエルゴプロッターホック問題には、(i)因果関係の逆転と(ii)内生性の2つの側面があります。

「可能性」の逆の因果関係の例: -社会飲むと収益の飲酒はベサニL.ピーターズ&エドワード・ストリンガム(2006に従って、より多くのお金を稼ぐ:「?酒飲みはより多くのお金よりも非飲酒者を獲得なぜ、あなたが失うかもしれない酒」労働のジャーナルをResearch、Transaction Publishers、vol。27(3)、pages 411-421、June)。または、より多くのお金を稼ぐ人々は、彼らがより大きな可処分所得を持っているか、またはストレスのために多くを飲みますか?これは、測定エラー、応答バイアス、因果関係などを含むあらゆる種類の理由について議論するための素晴らしい論文です。

「可能性のある」内生性の例:ミンサー方程式は、教育、経験、および経験の二乗ごとにログ収益を説明します。このトピックに関する長い文献があります。労働経済学者は教育と収入の因果関係を推定したいが、おそらく「能力」は個人が持っている教育の量を増やし(それを得るためのコストを下げることにより)、収入に関係なく収入を増加させる可能性があるため、教育は内生的だろう教育のレベル。これに対する潜在的な解決策は、機器変数です。AngristとPischkeの著書、Mostly Harmless Econometricsがこれをカバーし、トピックを非常に詳細かつ明快に関連付けています。

私がサポートしていない他の愚かな例は次のとおりです。-一人当たりのテレビの数と死亡率の数。それでは、テレビを発展途上国に送りましょう。明らかに両方ともGDPのようなものに内因性です。-サメの攻撃とアイスクリームの販売数。両方ともおそらく温度に内因性ですか?

私はまた、狂人とクモについての恐ろしい冗談を言うのが好きです。狂人は、亡命者の廊下を、彼の手のひらの上で運んでいるspでさまよう。彼は医者を見て、「ドック、クモと話せます。これを見てください。「クモ、左に行け!」クモは正しく左に移動します。彼は続けます、「クモ、右に行きます。」クモはシャッフルします医師は、「興味深い、次のグループセッションでこれについて話す必要があります。」と狂気のレトルト、「それは何もありません。これを見てください。」彼はクモの各脚を一つずつ外し、「クモ、左に行け!」と叫びます。クモは手のひらの上で動かずに横たわり、狂人は医者に向きを変え、「クモを外した場合彼は耳が聞こえなくなります。」


8

私が教わった最高のものは、own死の数であり、アイスクリームの販売は高い相関があるかもしれませんが、それは一方が他方を引き起こすことを意味しません。アイスクリームのDr死と売り上げは、天気の良い夏の数ヶ月で明らかに高くなります。3番目の変数、別名晴天が原因です。


6

「海賊は地球温暖化を引き起こす」の一般化として:時間とともに(単調に)増加または減少する2つの量を選択すると、何らかの相関関係が見られるはずです。


6

Google Correlateに数分を費やして、あらゆる種類の偽の相関関係を見つけ出すことができます。


1
このリンクは質問に回答するかもしれませんが、回答の重要な部分をここに含め、参照用のリンクを提供する方が良いでしょう。リンクされたページが変更されると、リンクのみの回答が無効になる可能性があります。
GUNG -モニカ元に戻し

1
@gung、本気ですか?リンクは、回答を説明する簡単なページではなく、アプリケーションへのリンクです。リンクされたページが変更された場合、ツールは使用できなくなるため(現在のフォームで)、答えは無効になります。
ジェロームバウム14年

6

Algebra Oneのクラスで相関関係と因果関係を教えることに学生と協力しています。考えられる多くの例を調べます。2013年2月の数学教師の記事「Bundled-Up Babies and Dangerous Ice Cream:Correlation Puzzlers」が役立つことがわかりました。「潜んでいる変数」について話すアイデアが好きです。また、この漫画はかわいい会話のスターターです:

ここに画像の説明を入力してください

漫画の独立変数と従属変数を特定し、これが原因ではないにしても、原因の例であるかどうかについて話します。


4

1960年代初頭から始まった核兵器のテストがかつてないほど高かったので、特に米国での出生率(またはその方が望ましい場合は出生率)の低下に関する興味深い例を(かなり前に)読みました。 (1961年に史上最大の核爆弾がソ連でテストされました)。20世紀の終わり頃まで、料金は引き下げられ続けました。

現在、これらの数字を組み合わせた参考文献は見つかりませんが、このウィキペディアの記事には、国ごとの核実験の数字に関する数字があります。

もちろん、1960年代初頭に始まった避妊薬の「偶然の」導入と合法化と出生率の相関関係を見るほうが理にかなっているかもしれません。(最初に一部の州のみ、次にすべての州が既婚女性のみ、次に一部の州が未婚、その後全体)平等、経済の変化、およびその他の要因の他の多くの側面が重要な役割を果たします。


興味深い例は、一見したところ、最も愚かな例の多くとは異なり、考えられる因果関係のように見えるためです。
ボッシケナ

1
私が好きなのは、「効果」が実際に受胎能力に影響を与えることであるのか(妊娠する医学的意味で)、それが社会的であるのか(「子供をこの悪い状態にしたくない世界")。その後、誰もそれを育てていない場合、ピルについて爆弾を落としてください。そして、これも1つの可能性のある要因にしかならないことを指摘し、他のいくつかを議論します。
AdamV

4

相関関係だけでは、因果関係を確立できませんデビッド・ヒューム(1771-1776)は、純粋に経験的な手段では因果関係の特定の知識を得ることができないと非常に効果的に主張しました。カントはこれに対処しようとしましたが、カントのウィキペディアのページは非常にうまくまとめているようです:

カントは、自分が経験主義者と合理主義者の間で妥協を生み出していると信じていました。経験主義者は知識は経験だけで得られると信じていたが、合理主義者はそのような知識はデカルトの疑いに開かれており、その理由だけで知識を提供すると主張した。しかし、カントは、経験にそれを適用せずに理性を使用することは幻想にしかならないと主張し、経験は純粋な理性に最初に包含されることなく純粋に主観的であると主張します。

言い換えると、ヒュームは、相関関係を観察するだけでは因果関係が存在することを決して知ることはできないと述べていますが、カントは、私たちの理由を使用して、因果関係を示唆しない相関関係を区別しない理由を使用できることを示唆しています。カントが特定の知識ではなく、もっともらしさの観点から書いている限り、ヒュームは反対したとは思わない。

要するに、相関関係は因果関係を暗示する状況証拠を提供しますが、証拠の重みは関係する特定の状況に大きく依存し、私たちは絶対に確信することはできません。介入の効果を予測する能力は、信頼を得るための1つの方法です(何も証明できませんが、観察証拠によって反証することができるため、少なくとも因果関係の理論を改ざんしようとしました)。カントが示唆するように推論を適用できる別の方法は、他の形の証拠も説明する相関関係を観察する理由を説明する単純なモデルを持つことです。

注意事項:私は哲学を誤解している可能性は完全にありますが、相関関係が因果リンクの証拠を提供できない場合もあります。


2
何が価値があるために、現在の用語で、私はあなたが観察相関どんなものがある、1は第二同様に例えば、アサートとしてカントを読むべきだと思ういくつかのそれらを生成する因果グラフ。私の知る限り、彼は構造を特定するための特定の方法がありませんでしたが、完全に接続されている必要があると仮定しました(「すべてのイベントには原因がある」ため)。この意味で、彼は現代的です。因果推論には、たとえばグラフで表現された因果的仮定と、データの観察された規則性の混合が必要です。そして、あなたは通常、最初の部分を避けることも、データからそれを誘発することもできない
conjugateprior

+1よく説明されています!私はベイジアンすぎるかもしれませんが、因果関係について特定の知識を得ることができないという考えにあまり悩まされていません。
ディクラン有袋類



3

スロベニアの村の男性の精子数とクマの数(スロベニアでも)は負の相関を示します。一部の人々はこれを非常に心配しています。これを行った研究を試してみます。


3

私は最近会議に行ったことがあり、講演者の一人がこの非常に興味深い例を挙げました(ポイントは何か他のものを説明することでしたが):

  • アメリカ人と英語は多くの脂肪食を食べます。米国および英国で心血管疾患の割合が高い。

  • フランス人は多くの脂肪食を食べますが、心血管疾患の発生率は低いです。

  • アメリカ人と英語は多くのアルコールを飲みます。米国および英国で心血管疾患の割合が高い。

  • イタリア人は大量のアルコールを飲みますが、やはり、心血管疾患の発症率は低いです。

結論?食べたいものを飲みましょう。また、英語を話すと心臓発作を起こす可能性が高くなります!


3
また、生態学的な誤acyの良い例です(つまり、グループレベルのデータから個人レベルについて推論する)。
ジェロミーアングリム


3

私が使用した相関関係の別の例は、オーガニック食品を食べる人の数の大幅な増加と、米国で自閉症と診断された子供の数の増加です。ウェブ上にパロディグラフがあります- 自閉症有機食品パロディグラフ


3

http://tylervigen.com/

これは明らかに因果関係のない大量の相関関係を示しています-または、蒸気、高温蒸気、高温物体による殺人者と相関するエイジオブミスアメリカの相関関係の因果関係は何かわかりますか?


2

「相関関係は因果関係を意味するものではない」と教えることは、結局のところ誰も助けにはなりません。

人間は何かをしないことを学ぶのが非常に苦手です。

目標はむしろ建設的である必要があります。常に、同じデータを生成する可能性のある開始時の仮定の代替案について考えてください。


1
これは質問に応答しません。おそらくコメントとして理解されるべきです。
whuberの

2

私の教授は、これらを導入確率クラスで使用しました。

1)靴のサイズは読解力と相関しています

2)サメの攻撃はアイスクリームの販売と相関しています。


2

より多くの消防車が火に送られるほど、損害は大きくなります。


1
例としてこれに関する唯一の問題は、明確な逆因果関係があることです。
-naught101

1

より良いパラダイムは、信頼できる、できれば実証済みのメカニズムに関連付けられた相関関係を必要とする因果関係かもしれません。暗示という言葉は、提案を含むいくつかの意味があるため、この文脈では非常に控えめに使用する必要があると思います。


1

コウノトリの例は、Box、Hunter&Hunterの本「Statistics for Experimentalers ...」(Wiley)の初版(1978)の8ページにあります。第2版​​かどうかはわかりません。彼らは都市をオルデンブルク、期間を1930-1936と特定しています。

彼らは、Ornithologische Monatsberichte44、No 2、Jahrgang、1936、ベルリン、および48、No 1、Jahrgang、1940、ベルリン、およびStatistiches Jahrbuch Deutscher Gemeinden、27-33、1932-1938、Gustav Fischer、イエナを参照しています。


0

私は記事で面白いものを見ました。

バングラデシュのバター生産は、10年間でS&P 500と最も高い相関関係の1つを持っています。

http://www.forbes.com/sites/davidleinweber/2012/07/24/stupid-data-miner-tricks-quants-fooling-themselves-the-economic-indicator-in-your-pants/


2
え?グラフは、S&Pを経時的に示しています。タイトルは、グラフには表示されないバターとチーズの生産について説明しています。???
ハーベイモトゥルスキー


3
はい、わかりました。このグラフは、重回帰モデルの予測を示しており、3つの愚かな変数を含めると、モデルがSP500の経時変化を予測するのに非常に優れた働きをすることを示しています。これは、重回帰における過剰適合の良い例であり、相関関係(または空想モデルの適合度の向上)が因果関係を意味しないことを間接的に示しています。
ハーベイモトゥルスキー

0

これは完璧なものです。残念ながら、ワシントンポストのスタッフも疾病管理予防センターも、The Onionの記事が風刺作品であるべきであるという知識を実証するものではないため、優れた指導ポイントとして使用できます。

https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=.9dd329c2e837


3
リンクが間違っていると判断しただけでなく、リンクの背後にある発言を要約してください。
cbeleites

ごめんなさい。しかし、これは一目瞭然だと思いました。
マークC。

2
リンクはソースへの参照としては問題ありませんが、誰もが実際にそれを読むことができると仮定するべきではありません(またはそれほど面倒ではありません)。このようなリンクはリンク腐敗の影響を非常に受けやすく、すべての新聞がすべての地理的地域にサービスを提供するわけではありません住所)。
cbeleites

-2

誰かが言った、相関関係は因果関係を意味しないかもしれないが、確かに良いヒントになり得る:)

楽しい部分はさておき、因果関係とは何ですか?海賊は地球温暖化を引き起こさないと本当に確信していますか?

直観に反しますが、何が原因とみなされ、何が結果とみなされますか(相関研究ではそれほど明確ではありません)。もちろん、多くの場合、両方とも単に一般的な原因の影響である可能性があります(したがって相関します)

それはすべて、因果関係を決定する方法に要約されます。

これは、ことわざの原因です(意図されたしゃれ):

ささいな嘘があります。大きな嘘があり、統計があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.