相関関係が因果関係を意味しない場合、2つの変数間の相関関係を知ることの価値は何ですか?


11

ビジネスオーナー(またはマーケティングまたは散布図を理解している人)が2つの変数の散布図を表示しているとしましょう:過去5年間(またはより多くのサンプルがあります。これを作成しました)。

今、彼/彼女は散布図を見て、相関係数(corr)が次のようであると伝えられます:

  1. 1または
  2. 0.5または
  3. 0.11または
  4. 0または
  5. -0.75または
  6. -1

基本的に有効な値 corr

質問:これは、意思決定者や散布図の消費者にとってどのような意味がありますか?これだけに基づいてどのような決定を下すことができますか?

つまり、任意の2つの変数間の相関関係を確認する用途は何ですか。また、その情報を単独で使用して何ができるのでしょうか。回帰分析に含めるために何を考慮すべきか、何を考慮しないかを確認するためだけのものですか、それとももっと実用的な用途がありますか?

興味津々ですが、私はいつもこのテクニックを使用してきましたが、相関関係だけではあまり役に立たないと言われています。

回答:


12

いくつかの考え:

  • 因果関係ではない相関についての古いカナードは話の半分にすぎません。相関は因果関係ではない可能性がありますが、2つの変数間の何らかの形の関連付けは、因果関係を示すための経路に沿って必要なステップであり、相関関係はそれを示すのに役立ちます。
  • 傾向を指摘するのに役立ちます。それをビジネスオーナーに見せると、彼らは「そうですね、それは理にかなっています。ウィジェットXとウィジェットYは、実際には関係がないにもかかわらず、特定のグループの人々によって使用されることになります。あるいは、彼らは言うかもしれません。 「それは…おかしい」、その時点であなたはさらなる調査を促しました。
  • このように見てください。相関はツールです。ハンマー自体は、それほど便利ではありません。確かにそれだけで家を建てることはできません。しかし、ハンマーなしで家を建てようとしたことがありますか?

5
最初の箇条書きで、相関は因果関係の必要条件であると述べています-それは真実ではありません。2つの変数間に非単調な関係がある場合、それらは無相関である可能性があります-これは因果関係を排除しません。
マクロ

@マクロ-正しい、編集済み
Fomite

@Macro True、実際には、関数を変数に適用して、リレーションを単調にテストすることができます。この機能がわからない場合は...探しているものについてあまり知らない
RockScience

@EpiGrad:2つの変数のXY相関グラフが幸せな笑顔(または他の任意の形状)のように見えると仮定します。相関係数は実際には非常に小さいですが、確かにいくつかの相互関係がありますよね?そのような場合、どのように/何をすべきですか?
PhD

@Nupul線形性を超えた、XYのやや複雑な探索。
フォミテ

7

ギャンブルの観点から見てください。仕事で長靴を履いた人は平均して1.5人の怪我をし、ローファーを履いた人は平均で.05人の怪我をすることを知っているとしましょう。または、ワークブーツを着用している人の怪我の可能性は.85であり、ローファーを着用している人の怪我の可能性は.1です。

人口から無作為に人を選び、その人が長靴を履いていると伝え、昨年彼らが職場で怪我をしたかどうかについてあなたに平等な賭けをするなら、あなたは賭けをしますか?まあ、彼らが怪我をしていた側に賭けることができたなら、あなたは賭けを取るでしょう。85%の確率で勝つことができ、お金さえもらえます。

重要なのは、その情報の一部が彼らが仕事で怪我をする可能性があるかどうかについての情報を私たちに与えることを知ることです。靴はそれとは何の関係もありません、実際、作業靴は怪我を防ぎます。ワークブーツと一緒に行く仕事の種類です。そして、おそらく他の人がおそらくより無謀であるような他のもの。


6

「相関は因果関係を意味するものではない」という表現は誇張されています。(コーエンが書いたように、「それはひどく大きなヒントです。」)私たちは、人間の心に固有の偏見のために、このフレーズを学生に打ちのめしました。「犯罪率は貧困率と相関がある」などと聞いたら、貧困が犯罪の原因だと思わざるを得ません。それが心の働き方なので、人々がこれを想定するのは当然です。私たちはそれを打ち消すことを期待してこのフレーズを何度も使用しています。ただし、アイデアを吸収すると、フレーズはその価値のほとんどを失います。次は、より高度な理解に移ります。

2つの変数の間に相関関係がある場合、2つの可能性があります。それはすべて偶然であるか、またはいくつかの因果パターンが働いています。世界のパターンを偶然と呼ぶのは恐ろしい説明の枠組みであり、おそらく最後の手段となるはずです。それは因果関係を残します。問題は、その因果パターンの性質がわからないことです。貧困は犯罪を引き起こす可能性がありますが、犯罪が貧困を引き起こす可能性もあります(たとえば、人々は犯罪の多い地域に住みたいと思わないため、引っ越しし、資産価値が低下するなど)。また、犯罪と貧困の両方を引き起こすいくつかの第3の変数または変数のグループが存在するが、実際に 直接的な犯罪と貧困の因果関係(「共通原因」モデルとして知られています)。統計モデルでは、他のすべての変動要因が従属変数の誤差項に集約されるため、これは特に危険です。その結果、独立変数は誤差項と相関(起因)し、内生性の問題につながります。これらの問題は非常に困難であり、軽視すべきではありません。それでも、このシナリオでも、実際の因果関係があることを認識することが重要です。

簡単に言うと、相関関係が見られるときは、おそらくどこか何らかの因果関係があると考えるべきですが、その因果パターンの性質はわかりません。


4

私はこれらのことに精通していると思いましたが、私が辞書で「黙示的に」調べたところ、それが2つの著しく異なる意味を持つことに気づいたのは先月だけでした。1.提案および2.必要。(!)相関が原因を必要とすることはめったにありませんが、それは確かにそれを示唆することができます。@EpiGradが指摘するように、因果関係を確立するためには、十分ではありませんが必要条件です。

時が経つにつれ、相関を最終的なものと見なすことと完全に役に立たないと見なすことの中間点が見つかることを期待しています。そして、相関結果を解釈する際に、サブジェクト/ドメイン/コンテンツ固有の知識を考慮に入れます。あなたが説明する広告販売の結果を見たときに、少なくとも因果関係があることに疑問を呈する人はほとんどいません。しかし、他の可能性、観察された関係を少なくとも部分的に説明する可能性のある他の変数を受け入れることは常に良いことです。交絡変数、妥当性などに関する読みは、大きな配当で報われます。たとえば、クックアンドキャンベルの古いクラシックな準実験には、有効性と有効性への脅威に関する優れたセクションがあります。


1
@EpiGradで指摘したように、相関は因果関係の必須条件ではありません。データ分析には、変数間の関係が常に単調な関係を指すという概念が広まっています。これは、相関が因果関係の必要条件であることを示唆することで暗黙的に想定されています。
マクロ

1
けっこうだ。それでは「統計的関連」が必要だとしましょう。
rolando2

2

相関係数は、他の関連性の尺度として、Xの値を知ることでYの値に関する情報がどれだけあるかを知りたい場合に役立ちます。これは、Xを特定の値に設定するかどうかを知ることとは異なります。あなたが得るであろうYの値(これは因果関係の事実に反する解釈の本質です)。

それにもかかわらず、多くの状況(予測など)では、相関に基づく推論はそれ自体で価値があります。黄色い歯は肺がんと相関しています(どちらも確率的にがんによって引き起こされるため)。2つの間に因果関係はありません:歯を白くすることは肺癌を治すことはできません。ただし、肺がんの可能性が高い人を対象に迅速なスクリーニング検査が必要な場合は、黄色い歯を確認することをお勧めします。

相関係数が関連性の最も優れた尺度であるかどうかは別の質問ですが、問題は、非因果的関連性を知ることの価値が何であるかについての詳細です。

ところで、相関は因果関係の十分な実証ではないだけでなく、必要でもありません。2つの変数は因果的に関連している可能性がありますが、特定のデータセットでは相関関係を示しません(たとえば、選択バイアスまたは交絡因子のため)。


1

相関それ自体はあまり役に立ちません-それで、その用途は何ですか?

相関関係は、2つの変数間の関連のレベルを知らせて、このフレーズに同意しません。次に、そのような変数間の関係を説明しようとするときに役立ちます。一方、(マクロが書いたように)相関は因果関係の必要条件ではありませんが、関連のレベルを説明するには十分です。さらに、変数の独立性をテストすることもできますが、相関関係により、別の有用な情報である決定係数が得られます。

それにもかかわらず、アナリストは、そのような関係を説明できるようにドメインを知る必要があります。


これが何を意味するのかFurthermore, you can test the independence of the variables, but correlation can give you another useful information, the coefficient of determination
PhD

つまり、「変数の独立性をテストできる」ということですが、とにかく、独立性をテストしていなくても、相関関係の情報と係数をテストできます。変数間の関係の種類を理解して説明するために、決定の「有用性」があります。
ホセ・ズブコフ

1

データ収集と研究デザインもこの質問への回答に役割を果たすと思います。観察研究であっても、研究を設計し、互いに完全に無関係な一連のデータを収集することはありません。したがって、「相関関係は因果関係を意味しない」ことは正当化される可能性があります。因果関係ではありませんが、関連があるかもしれません。

ただし、2つのデータセットについて完全に無関係であるが、相関を使用して関連と因果関係を説明したい場合は、不適切である可能性があります。たとえば、2つのデータセットがすべて下降傾向にある場合、たとえば、アイスクリームの売上と結婚の数は、相関係数が非常に高くなる可能性があります。しかし、協会を意味する必要があるのでしょうか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.