相関は因果関係を意味するものではありません。しかし、変数の1つが時間である場合はどうでしょうか。


41

私はこの質問が10億回も聞かれたことを知っているので、オンラインで調べた後、2つの変数間の相関は因果関係を意味しないと完全に確信しています。今日の統計講義の1つで、物理学における統計的手法の重要性について、物理学者からゲスト講義を受けました。彼は驚くべき声明を述べた:

相関は因果関係を意味するものではなく、変数の1つが時間である場合を除きます。したがって、いくつかの独立変数と時間の間に強い相関がある場合、これは因果関係も意味します。

この声明を聞いたことがありません。物理学者/相対論者は「因果関係」を統計の人々とは異なるものと見ていますか?


12
これはあいまいな記述であり、おそらく真実ではありません。時間は、放射性崩壊以外の多くを引き起こしません。語彙は年齢とともに向上する傾向がありますが、それは完全に社会化と教育によって媒介されます。この声明が主張された背景と問題を説明できますか?
AdamO

@AdamO 一時的な優先順位を知っていれば因果関係の条件単純ですが、この質問ほど単純ではありません。
ニールG

2
彼らはグレンジャーの因果関係を説明しているようだ。
バーカー

1
物理学者が因果関係をどのように見ているかを本当に知りたい場合、物理学でそれらの答えを得る可能性が高いことに注意してください。この質問の修正版がトピックに含まれている可能性があります。
デビッドZ

2
独立変数としてモデルに時間を追加するということは、従属変数を生成するデータ生成プロセスをモデル化するのに多くの時間を費やさなかったことを意味すると聞いたことがあります。
アレクシス

回答:


37

現在提供されているものは物理学者が述べた重要な点を見逃していると思うので、別の答えを提供します。引用文は次のとおりです。

「相関は因果関係を意味するものではありません。変数の1つが時間でない限り、ある独立変数と時間の間に強い相関関係がある場合、これは因果関係も意味します。」

物理学者は言ってない:

「XとYが相関し、XがYの前に来る場合、相関は因果関係を意味します。」

それは間違っているでしょう。物理学者言っていることは:

「Xと時間に相関がある場合、その相関、時間の増加がXの増加(または減少)を引き起こすことを意味します。」

例はエントロピーかもしれません。時間の経過とエントロピーの増加との間に強い相関関係がある場合、時間の増加はエントロピーの増加を引き起こすと言えます。エントロピーの増加の物理的原因(粒子の崩壊、宇宙の拡大など)は無視されることに注意してください。

因果関係の伝統的な要件の1つは時間の進行です。つまり、XがYの前にある場合にのみXがYを引き起こすことができます。ただし、変数の1つが時間の場合、時間の進行はすでに関係に組み込まれています(関係が存在する場合)。

編集:さまざまなコメントに基づいて、以下を追加します。物理学者はここで「因果関係」という言葉の別の考えを使っているのではないかと思います。彼は、独立変数と時間の間に相関関係がある場合、時間の経過とともに独立変数が予想通りに変化すると結論付けることができると言っているようです。一部の人々は、変更が時間の経過によって「引き起こされた」と言うかもしれません。これは、統計学者が「原因」または「原因」という言葉を実際に使用する方法ではないため、混乱の原因になります。


3
+1まさに、それは私が声明を解釈した方法でもあります(以前のコメントと回答を参照してください)
ルーベンファンベルゲン

5
グラフィカルモデルで時間を変数にする場合、時間には原因がなく、すべてが原因です。したがって、時間はすべてを引き起こすので、時間は特定のことを引き起こすことを示唆するのは空虚な主張です。
ニールG

2
曖昧であるかどうかにかかわらず、これは物理学者が言ったと一致するように見える解釈です。メッセンジャーを撃たないでください;)。また、実際に時間の原因となるものを実際に考慮することは些細なことだと思っていても、相関関係と因果関係の関係を人々に教育することを目的とする場合、それは価値があると思います。
ルーベンファンベルゲン

6
@ GeoMatt22-「時間はすべてを引き起こす」という考えには同意しません。コインを何回もひっくり返すことを検討してください-たとえ何時間もひっくり返しても、頭の割合は約1/2になるはずですので、時間が頭を上下させる確率を「引き起こす」ことはありません。部屋にアイスキューブを置くと、温度が上昇し、時間がたつにつれて溶けます。この場合、時間は温度平衡を「引き起こします」。これは、統計学者が使用する「原因」という言葉の別の意味かもしれませんが、物理学の観点からの機能的な解釈だと思います。
ダンカン

6
ポイントは、変数が時間の経過を引き起こすようなグラフィカルな構造を決して考慮しないということです。したがって、唯一のグラフィカルな構造は、時間が他のすべての変数の原因であるということです。(あなたの例のように)それらにはまったく影響を与えないかもしれませんが、因果的な矢印は因果的なグラフィック構造に関する主張であり、観察介入を前提とした条件付き独立関係を意味します。影響力は別の質問です。
ニールG

15

私たちは物理学者が何を意味したのか分かりません。2つの異なる解釈が続きます。


XYYXYXYXYXYWXWYXVZWYZXY

ただし、時間的優先順位により、因果関係を主張する条件が大幅に簡素化されます。これは、Pearl's Causality book Chapter 2.7「因果関係のローカル基準」で見つけることができます。

XYZSX

  1. (Z⊥̸YS)
  2. (ZYSX)

本質的に、(1)ことを意味の潜在的な原因であり、時間優先与え、及び(2)ことを意味し場合にのみ起こることができる関係、破壊することができ原因。Y X X YZYXXY

この状態は、一時的な情報のない真の原因に関するパールの定義よりもはるかに単純です。


他の回答のいくつかで概説された別の可能性は、物理学者がが時間の経過でと相関している場合、が引き起こすことを意味したということです。この記述は正しいですが、時間の経過が他のすべての変数の原因であるため、空虚です。つまり、因果的なグラフィカル構造がこのようになっているということです。因果関係のグラフィカルな構造は、観察と介入が与えられた場合の独立関係に関する一連の主張です。Y X YXYXY


2
GeoMatt22の答えへのコメントで述べたように、物理学者の声明が優先的に関係があるとは思わない。
ルーベンファンベルゲン

2
@RubenvanBergen別の回答で説明したように、その解釈は空虚です。時間はすべてを引き起こします。
ニールG

あなたの例では、とは依存していますが、相関していません(とが指定していない接続を介して相関していない限り)。X Y V WXVZWYXYVW
ルーベンファンベルゲン

@RubenvanBergenそれらは相関している可能性があります。それは依存関係の性質に依存します。ちなみに、観測された場合、とは依存していると言いました。Y ZXYZ
ニールG

1
@RubenvanBergenあなたは矢を誤解していると思います。これらは因果関係の矢印であり、で説明するため、情報はから流れる可能性があります。が「雨」、が「スプリンクラーがオフ」、が湿った地面、が雨の音、がスプリンクラーがオフのインジケーターであることを考慮してください。地面が濡れているとすると、説明のためにはと相関しています。W Z V W Z X Y X YVWZVWZXYXY
ニールG

10

ゲスト講師は、物理学では、複製を生き残る唯一の相関関係は、根本的な因果関係があるものであると推測したと思います。時間変数は、物理学者によって制御されない唯一の変数であるため、例外です。その理由は次のとおりです。

物理学では、通常、再現可能な現象と実験を扱います。実際のところ、実験は繰り返し可能であり、後日、または他の研究者が複製できることはほぼ当然です。したがって、が対象変数と独立変数観測値であるサンプルを観測するとします。上で述べたように、変数を完全に制御し、希望する値に設定できます。 x k x kyi,xkixkxk

あなたの物理学者は、この設定では、因果関係のリンクがない限り相関は表示されないと言っています。どうして?他の誰かまたはあなた自身が任意の組み合わせとシーケンスで実験を繰り返し、因果関係との相関関係のみが実験の複製を生き残るためです。実験のすべての可能な組み合わせで十分なデータを収集すると、他の(偽の)相関はすべて消えます。x k jCorr[y,xk]xkj

この状況は、社会科学や、実験ができないビジネスアプリケーションとはまったく対照的です。国のGDPのシーケンスを1つだけ観察し、失業率を変更して他のすべてを平等にし、相関関係を観察することはできません。

現在、物理学者が制御できない変数は時間だけです。2017年1月1日のみです。彼はこの日を繰り返すことはできません。彼は他の変数を繰り返すことができますが、時間は繰り返しません。それが時間(経過した時間や年齢ではない)になると、物理学者は他の皆と同じボートにいる理由です:相関関係は彼の因果関係を意味しません。


5

私はこれを聞いたことがありません。そして、私がよく知っている因果関係の概念によれば、それは真実ではありません(私は物理学者ではありませんが)。

通常、がを引き起こすには、が時間的にに先行する必要があります。したがって、が先行する場合、相関に関係なく、によって「引き起こされる」ことはできません。また、先行ない十分な(もかかわらず、任意の相関の)因果関係の条件。Y X Y Y X X X YXYXYYXXXY


1
この物理学者の意味を誤解していると思います。私は、2つの変数が互いに相関している状況について言及していると思います。これらの変数の1つは時間です。どちらの変数も時間ではないと仮定していますが、時間の出番は、1つの変数が他の変数に先行することです。
ルーベンファンベルゲン

3
変化が何かによって「引き起こされる」ためには通常、時間の経過が必要であることを示しようとしましたが、と相関関係は通常「因果関係」(は必要だが十分ではない)。私は、これが物理学者の意図したことなのかどうかわからないことを伝えようとしました。物理学者は通常、「...時間の経過によって引き起こされる」ではなく、「時間の経過による炭素14の減少は放射性崩壊によって引き起こされる」と言うでしょう。(おそらく「時間の経過が必要」)Y トントンΔ トンYYttΔt
。-GeoMatt22

@RubenvanBergenおそらく、講師はウィキペディアが「因果構造」と呼ぶもののようなものの簡略版を表現しようとしていたのでしょうか?時間との相関(十分に細かいスケールで)は、「時間のような方向」の微分可能性を意味します。私はそれを誤解しているかもしれませんが、ウィキペディアをざっと読んで、上記で書いたものと同様の使用法を提案しています。「因果構造」は「先例」の意味を定義します。しかし、それでも私には「必要だが十分ではない」ように思えます。
GeoMatt22

「相関は因果関係を意味するものではありません。変数の1つが時間でない限り、独立変数と時間の間に強い相関関係がある場合、これは因果関係も意味します。」私にとって、これは時間と相関する変数Xがあることを意味します。私たちは、時間の経過がXを引き起こすのではなく、時間の経過がXを引き起こすと結論付けます。後者は無意味であるためです。
ルーベンファンベルゲン

4

これは必ずしも時間はユニークではないと思いますが、それは確かに良い例です。ポイントは、通常、AとBが相関している場合、何らかの共通の因果関係があると推測できるが、AがBを引き起こすのかBがAを引き起こすのか、あるいは3番目の変数CがAとBの両方を引き起こすのかわからないということです。 、ある場合には、その除外することができる任意の他の変数は、Aを引き起こし、それは、AがBにその一例は、制御実験で引き起こしたことでなければならないので、もし変化があなたが作る場合、実験者、コントロールA. AはBの変化と「相関」します。Bを変化させたのはAであり、Bの変化ではないはずです。

別のタイプのシナリオは、時間のあるこの例に当てはまりますが、Aに影響を与えるものは何もないことがわかっているため、他の変数がAを引き起こしたことがないことを単に知っている場合です。世界の他の変数について、もし時間があなたが興味を持っている変数の変化(例えば、地球上の人々の数)と相関するなら、あなたは時間の経過がその変数を変化させたに違いないことを確かに知っているあなたの変数が時間の経過やその他の変化を引き起こしている(つまり、より多くの人が生まれたため時間は進みませんでした。それは逆でなければなりません)。

もちろん、あなたがまだ知らないのは、因果関係が直接的かどうかです。おそらく、時間の経過自体は、より多くの人間を自動的に生成しません。むしろ、歴史の展開は社会のさまざまな側面で進歩を引き起こし、これは人口の規模を増大させます(そしてそれは多くの小さな原因関係の単純化でもあります)。しかし、プレイ中の正確な要因に関係なく、Aは(最終的に)Bにつながり、その逆ではないことを確実に知っています。


最初の段落では、3つのケースが網羅的ではありません。相関と互換性のある他のグラフィカル構造があります。
ニールG

を引き起こす他のすべての変数を除外することは、現実的な問題では不可能です。につながる原因による情報の流れを除外する方法があります。これはバックドアメソッドと呼ばれます。これにより、因果関係を確立できます。A BAAB
ニールG

1
別の回答で述べたように、「時間の経過」を変数として解釈し、それが他の変数の原因でなければならないと主張するという考えは、空虚です。この時間変数がすべての原因です。
ニールG

大まかに言って、リストしたオプションはすべて可能性があると確信しています。AがBを引き起こすか、BがAを引き起こす(直接または間接)か、またはAとBの両方を引き起こす何かがある可能性があります。もちろん、これらの組み合わせも可能です。同時に、3番目の因子CもAとBの両方に因果的に影響しています。そして、別の選択肢として偶然の一致があると思いますが、それは退屈です。しかし、他の可能性について知りたいと思います。
ルーベンファンベルゲン

1
私の答えをチェックしてください。さらに多くのケースがありますが、4番目のケースを示しました。
ニールG

4

実際、相関は因果関係を意味します。

AがBを引き起こしたか、CがAとBを引き起こした可能性があります。

ただし、相関は因果関係を証明しません。

これは自明です。


5
回答とコメントを見渡せば、ここでの会話はそのような些細さをはるかに超えたものであることがわかります。問題を評価するための助けとして、いくつかの投稿を確認することをお勧めします。
whuber

3

私はこれを数学的/統計的な議論ではなく意味論として解釈します。また、かなり厳しい一般化として受け止めます。

ブラッドフォード・ヒル基準多くの場合、疫学で使用するには、因果関係を考えるための良い枠組みを提供します。時間が要因であるかどうかにかかわらず、因果関係を明確に証明するものは何もありません。講師はそのような強い主張をしようとしていないと思います。ただし、多くの異なる要因を因果関係の合理的な引数として使用できます。

たとえば、ブラッドフォードヒルの基準は、変数間の関連の強さが因果関係の証拠を提供できることを示唆していますが、それだけでは十分ではありません。同様に、他の既知の/信じられている事実と一致する関連性は、一般的な知識と一致しない関連性よりも強い因果関係を示唆する場合があります。テンポラリティーも基準の1つです。原因がその結果に先行する必要があります。関連と因果関係についての推論は、一時的な意味を持たなければなりません。他の基準を確認することをお勧めします。いくつかは疫学に固有のものであり、物理学には適用できませんが、それでも有用な考え方です。

要点は、単一の証拠が因果関係を明確に証明することはないが、多くの異なる論理チェックに基づいて、そのための良いケースを構築できるということです。時間などの1つの基準に絶対的な優先順位を与えることは適切ではありませんが、因果関係が妥当であると主張する際には、時間性が重要な要素になる可能性があると主張します。

これは統計に関するより広いポイントにつながります。一般的に言えば、議論をするために統計を使用します。データと統計ツールを使用して特定のポイントを示します。多くの場合、同じデータ(さらには同じツール)を使用して、競合するポイントを作成できます。数学自体に因果関係の決定的な証拠を見つけることはできませんが、より広範な議論の一部として統計ツールを展開できます。詳細については、Abelson's Statistics as Principled Argumentをお勧めします。

これを元の状況にループバックするために、溶液中の特定の化学物質の濃度がその溶液の温度に及ぼす影響について実験したとしましょう。この化学物質をさらに追加すると、温度が上昇する反応が生じると思われます。時間の経過とともに徐々に追加します。時間に対して温度を見て、増加を確認できます。これが示すすべては、温度が時間とともに増加するということです。時間自体(またはそのほかの何か)に何らかの因果関係があることを証明していません。しかし、この化学物質の濃度が増加すると温度が上昇する反応が生じるというより広範な議論でいくつかの証拠を提供します。


「時間的優先順位」のヒル基準を時間自体の露出に適用するのは独特の考えです。確かに時間は時間そのものに先行していました。私たちが知っているトレンドはめったに因果関係ではありませんが、他の同時現象を反映しています。この例では、時間は何も引き起こしたとは思いませんが、露出と結果の両方に影響する設定のグローバルな変化をまとめました。
AdamO

データの一部として時間がある場合、それを使用して因果関係に関するより広範な議論の一部を作成できると言っているほど、議論を時間自体に適用しているとは言いません。私たちの観察が時間的に意味をなすことを実証することにより、合理的な因果論に近づきます。うまくいけば、より強力な議論を作成するために、それよりもかなり多くの作業を行えるようになります。
djlid

3

この文は非常に単純であり、考え直す価値はありません(優先順位とは関係ありません)。

場合があり確立変数と時間との相関関係は(私たちは、IE 知っている時間の増加は、変数の増加を伴うこと、そしてこれがされて与えられた)、その後、私たちは「因果」の方向を知っている:すなわち、時間が増加し、原因増加させる変数。

「なぁー、変数が最初に増加したために時間だけが増加した」という対立仮説は、時間の仕組みを考えると単純に我慢できないからです。


これは馬鹿げた観察のように聞こえるかもしれませんが、原因の方向性を証明しようとする研究デザインに重要な意味を持ちます。医学の重要な例は、横断的研究とコホート研究の違いです。

たとえば、喫煙とがんの関連性を探る横断的研究では、あるグループを喫煙者と非喫煙者に分け、各グループの何人ががんと非がんを持っているかを調べます。しかし、喫煙とがんの相関関係は「がんにかかっている人は喫煙を楽しんでいる可能性が高い」と解釈される可能性があるため、これは弱い証拠です。

ただし、コホート研究を実行する場合、つまり喫煙者のグループと非喫煙者のグループを取り、それらを経時的に追跡し、変数「喫煙者のがんから非喫煙者のがんを引いたもの」を測定し、陽性を確立する場合この変数と時間との相関(合理的な仮定の下では、一度開始された喫煙量が一定で時間に依存しないなど)、「時間」が癌の違いの原因であることがわかります。喫煙グループでより多くの時間を過ごしました。したがって、時間の経過と喫煙者グループの割合が高いことに関連するがんの正の差との因果関係を主張できます。(または、もっと簡単に言えば、喫煙グループに属する時間は、がんリスクの比例した増加を引き起こします)。

さらに、横断研究の弱点、すなわち「がんの人は喫煙をする可能性が高い」という可能性は、変数としての喫煙が「時間対がん」から除外されたため、今や窓から消えています。方程式(ここでは一定であると仮定され、したがって時間の影響を受けません)。言い換えれば、このように研究を定式化することにより、非常に具体的な因果関係の方向性を検討しました。因果関係の方向がどの程度適用されるかを調べたい場合(つまり、時間が経つにつれて最終的に癌になる人が喫煙をする可能性がどのくらいあるか)には、必然的に分割されたコホート研究を設計する必要があります。 「未来の癌対未来の癌」と時間の経過とともに喫煙の取り込みを測定します。

コメントへの応答を更新します。

これは、直接的な因果リンクを見つけることではなく、因果方向に関する議論であることに注意してください。交絡の問題は別のものです。(つまり、独立した存在ではないことを示唆するものは何もない第三という変数の両方が喫煙であることが、あなたは可能性が高くなりますし、時間とともに癌のあなたのチャンスを向上させるには)。すなわち、反事実的な因果関係の観点から、「これらの人々を喫煙させなければ、癌にならなかった」ことを明確に示していない。しかし、我々は持っています「時間が経過していなければ、喫煙グループと癌との関係は増加しなかったであろう」ことを示した。(すなわち、この関連性は、がん患者のスナップショットにとどまるものではなく、喫煙グループに参加するかどうかの単なる好みではなく、時間とともに強化されています)。


4
「したがって、喫煙者であることによって、時間の経過とより多くのがんの発症との因果関係を主張できます。—いいえ、できません。ロナルド・フィッシャーir(!)の支援を受けたタバコ会社は、遺伝的素因が喫煙と癌の潜在的な一般的な原因であると長年主張しました。このまさに例は、Pearlの本(p。353)の裏にあります。
ニールG

@NeilGいいえ、定式化されている例に賛成です。あなたが主張しているのは、逆の因果関係ではなく、交絡の問題です。私の例は、現状では、喫煙グループで費やされた時間が癌の発生率の増加と関連していることを示しています。Buこれ自体は、「遺伝的素因」が喫煙グループの増加率の背後にある原動力ではないことを証明していません。2つの異なるもの。ここでのポイントは、時間変数として因果的方向を導入することで「逆因果関係」の議論が根絶されるということです(つまり、がんは喫煙を取り込んでしまいます)。
タソスパパスティリアーノウ

1
あなたのコメントは正しいですが、あなたが書いたものと一致していないようです。「喫煙に費やす時間が、がんリスクを比例的に増加させる」と書いています。それは不当です。
ニールG

1
@NeilG公平、あなたは正しい。私はそのような精査を期待していなかった、ハハ。私はもう少し正確に言い換えます。
タソスパパスティリアーノウ

なぜ時間の進歩が引き起こされないのは、必ずしもそうなのでしょうか?時間を進める原因となるものがある可能性をどのように決定的に除外できますか?それは非常に強力な証拠を必要とする最も異常な主張であるように思えます。
デビッドシュワルツ

3

これは、因果関係を確立する方法の実際の問題です。なぜなら、関連しているが原因ではないイベントは、時間または空間で相関している可能性が高いからです。いくつかの相関データを見て、関係が依存しているかどうかをどのように判断できますか?賢明な研究顧問はかつて私に言った、「相関は因果関係を意味するのではなく、どこを見ればいいかを教えてくれる」

イベントAとBが時間的または空間的に相関していることがわかった状況を考えてみましょう。AがBを引き起こす前置詞を調査したい場合、伝統的な考え方は、必要性十分性のテストを導入することです。これが因果関係が本当に意味するものです。

  • 欠如した場合、イベントAのの欠如につながる事象B、それを呼び出すことができる必要
  • 場合のみ、 イベントへの単独のリードイベントB、それを呼び出すことができます十分

牛乳ないと行く場合、私たちが言っているのは、空の牛乳に入って運転するということではありません。絶対的な因果関係とは、まだ牛乳を飲んでいるときはいつでも店に行く気になれないということです。反対に、店にいるときはいつも、牛乳がないからです。厳密な意味で積極的に因果関係を確立することで問題を簡単に理解できるようになりました。ほとんどのことは絶対的な因果関係ではありません。牛乳の状態とは関係のない店に行く理由は他にもたくさんあります。

これは、優れた論文と申し分のない論文を区別する簡単な方法です。慎重な調査では、どこでも十分性と必要性​​のテストが行​​われます。小分子薬Aがタンパク質複合体Bの分解につながる可能性があるという主張をする?テストがすぐに表示されます。

必要性 ----test---- ----result---- everything but B --> [nothing] (check for false positive) everything but A --> assembled everything with A-like compound --> assembled (control group)

十分 A + B alone (in vitro) --> disassembled (check for false negative) A + B + everything --> disassembled (trial group)

これは、相関を使用して実験的に因果関係の帰納的議論を構築する伝統的な方法です。


1
ポイントを強調するために、時間依存性も因果関係を意味しません。イベントAがイベントBにつながることがよくあり、AではなくCを引き起こすのはBです。
マイケルチャーニック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.