データ内の因果関係をどのように見つけますか?


11

「A」、「B」の列を持つテーブルがあるとしましょう

「A」が「B」を引き起こすかどうかを判断する統計的方法はありますか?次の理由により、ピアソンのrを実際に使用することはできません。

  • 値間の相関関係のみをテストします
  • 相関は因果関係ではありません
  • ピアソンのrは線形関係のみを相関させることができます

では、他にどのようなオプションがありますか?


1
存在しない。このようなデータから、高度な相関関係を実証できます。因果関係を示すことはできません。


1
因果関係は、数値から絞り込めるものではありません...したがって、繰り返します。因果関係は相関関係ではなく因果関係は相関関係ではありません ...
JMは統計学者ではありません

1
ジュデア・パールの「因果関係」(2011年チューリング賞受賞)をご覧ください。

回答:


4

これまでの回答とコメントは基本的に実用レベルでは正しいですが、完全を期すために、ベイジアン統計とグラフ理論に基づく、いわゆる因果関係モデルの研究があります。したがって、一般的な相関関係は確かに因果関係を意味するものではありませんが、因果関係を解明しようとするより複雑なモデルがあります。詳細については、Judea Pearl 著の因果関係の本を参照してください。ただし、これは非常に強力な数学であり、おそらくあなたが望むものではありません。


2

データが観察結果である場合でも、因果関係について信頼できると主張できる、いわゆる準実験的な方法が数多くあります。これらの方法は通常、対象となる変数の外因性変動の原因を見つけることに依存しています。

私は、本の「ほとんど無害な計量経済学」に、アクセスしやすい概要が示されていると思います。それらは基本的に、人々(つまり、経済学者)が(少なくともときどき)信じている準実験的な方法をすべてカバーしています。それらは、例えばtrb456によって言及されたメソッドをカバーしません(同じ理由で、多くの人がそれらを信じていません)。


1

因果関係を判断するには、ランダム化テストを実行する必要があります。あなたはあなたの被験者を選び、無作為にそれらの半分を質Aにするために選び、半分を質Aを得ないようにします。次に、2つのグループ間で品質Bに統計的に有意な差があるかどうかを確認します。

測定を行う前に、ランダム化を行うことが重要です。特に、とすでに測定されているデータセットが与えられた場合、原因を特定することは不可能です。BAB

実行したいランダム化テストを実行できない場合があることに注意してください。たとえば、背が高いと体重が増えるかどうかをどのようにテストできますか?確かに身長と体重の間には相関関係がありますが、1つのグループを「背の高い」グループに割り当て、もう1つのグループを「短い」グループにランダムに割り当てることはできません。この場合、ランダム化テストは実行できません。


0

Somers 'dは、ピアソンの相関係数がデータセットに対して行う方法で、順序変数間の関係を説明するために機能します。


1
因果関係を確立するには、数よりも多くの時間がかかることに同意します。序数変数の使用はどのように問題に入りますか?
マイケルR.チェニック2017

1
@MichaelChernick Somers 'Dは、関連の非対称的な尺度です。。。それは曇りであれば、その後、雨が降っている『それは序数以上のデータのために働くそれが因果関係を確立していない「から「、雨が降っている場合、それは曇りである』を区別することができますが、それは方向性を確立しません。
デイブ・ハリス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.