相関は関連付けと同等ですか?


27

私の統計学教授は、「相関」という言葉は変量間の線形関係に厳密に適用されるのに対し、「連合」という言葉はあらゆるタイプの関係に広く適用されると主張しています。言い換えれば、彼は「非線形相関」という用語は矛盾表現であると主張している。

相関と依存関係」に関するウィキペディアの記事のこのセクションで作成できることから、ピアソン相関係数は2つの変量間の関係の「線形性」の程度を説明しています。これは、「相関」という用語が実際には線形関係にのみ適用されることを示唆しています。

一方、「非線形相関」をグーグルですばやく検索すると、この用語を使用する多くの公開論文が見つかります。

私の教授は正しいですか、それとも「相関関係」は単に「連合」の同義語ですか?


1
逆に、「線形関連付け」もあります。
ボグダノビスト

回答:


37

いいえ。相関は関連付けと同等ではありません。ただし、相関の意味はコンテキストに依存します。

古典的な統計の定義は、コッツとジョンソンの統計科学百科事典から引用すると「2つのランダム変数間の線形関係の強さの尺度」です。数学的統計では、「相関」には一般的にこの解釈があるようです。

データが数値ではなく一般的に順序付けられている応用分野(心理測定や市場調査など)では、この定義は、線形性の概念が間隔スケールプロパティを持つデータを想定しているため、あまり役に立ちません。その結果、これらのフィールドでは、相関は代わりに単調に増加または減少する二変量パターン、またはランクの相関を示すものと解釈されます。このために、多数のノンパラメトリック相関統計が特別に開発されています(たとえば、スピアマンの相関とケンドールのタウb)。これらは、線形性を仮定しない相関統計であるため、「非線形相関」と呼ばれることもあります。

非統計学者の間では、相関関係はしばしば関連付けを意味します(因果関係のある場合とない場合があります)。相関の語源に関係なく、現実は非統計学者の間でこのより広い意味を持ち、不適切な使用のために彼らを懲らしめることはこれを変えそうにないということです。私は「グーグル」をしましたが、非線形相関の使用のいくつかはこの種のようです(特に、一部の人々は数値変数間の滑らかな非線形関係を示すためにこの用語を使用しているようです) 。

「非線形相関」という用語のコンテキスト依存の性質は、おそらく曖昧であり、使用すべきではないことを意味します。「相関」に関しては、その用語の意味を知るために、その用語を使用している人のコンテキストを把握する必要があります。


6
+1思慮深く知識のある答え。最初の「いいえ」を修飾することを検討してください。「いいえ、教授は正しくない」または「いいえ、「相関」は「因果関係」の同義語ではない」、または2つの接続詞。
whuber

コメントありがとうございます。それに応じて回答を編集しました。
ティム

1
これは優れた回答(および質問)であり、一般的な用語、言語、およびコミュニケーションに関する幅広い問題を取得します。
ピーターエリス

3
では、関連付けとは何ですか?

5

「相関」と「関連」という用語を解きほぐそうとすることにはあまり意味がありません。結局、ピアソン自身(およびその他)は、非線形相関の尺度を開発し、それを「相関比」と名付けました。


1
はい、現時点では、特に歴史(たとえば、おっしゃるとおり)と社会的認識を考えると、それらを解くのは非常に難しいようです。
Behacad

2

協会の誤解があるようです。関連性の尺度(効果の大きさ)は定量分析に固有のものであり、定性分析ではありません。


1
たぶん、あなたはそれをコメントに変えることを考えるべきです。回答は通常もう少し拡張されました
-PhDing

@Alessandro Yup、答えにはもっと必要ですが、OPにはまだコメントするのに十分な評判(> +50)がありません。司会者はそれをコメントに変換することができます。
カール

0

相関関係は定量的データと定性的データとの関連に適用され、両方とも義務的な因果関係はありません。


「定性的データへの関連付け」とはどういう意味ですか?
ランデル

0

(男性の)体重が身長と相関しないという考え(対応する関数は線形ではなく3度であるため)は、私にとって非常に奇妙に思えます。線形相関は、関連の特殊なケースとして扱う必要があります。


1
しかし、あなたはどの(または誰の)アイデアに反対していますか?ここで相関は、(b)用語の任意の組み合わせからの観測値と予測値の相関、および(推定)(a)体重と身長の非ゼロ相関として計算できます。
ニックコックス

-1

相関と関連付けは異なります。相関は、正、負、および非相関の3種類の関係を表します。また、0から1、-1から0までの相関の大きさも記述します。関連付けは、関連付けのタイプと関連付けの程度を明らかにしません。


ここで質問は何ですか?
クリストフハンク

関連付けを定義したり、それがどのように異なるかを説明したりしないので、なぜあなたが質問に答えたと思うのかわかりません。これは以前の回答に追加されません。
ニックコックス

-2

線形性に関する限り、ティムとニックコックスの反応は完全にそれをカバーしました。私が貢献できると思ったのは、関連性と相関関係の違いを考えるきれいな方法です。

協会 ---対策密接にどのように関連した2つの変数がある(すなわち、それらは従属または独立しているかどうか)。

相関 --- 2つの変数がどのように関連するかを測定ます(正または負)。


最後に、それらを明確に扱うことは決して間違ってはいけないと主張します。それは長期的に解釈と分析に役立つでしょう。お役に立てれば。


2
これには賛成票を投じませんでしたが、肯定的なコメントに感謝します(編集を適用しました)。残念ながら、それは議論を混乱させます。関連付けの測定値は、多くの場合、どの変数が依存しているのかには関係ありません。相関は「どれくらい密接に」測定されます:相関の各定義は、変数が(理想的に)関連する方法の特定の定義に基づいています(線形、単調など)。例では、egmother、father、uncleは量的変数ではありません。だから、申し訳ありませんが、あなたが作る区別はまったくきれいではありません。
ニックコックス

また、「共有血液」と「疎外」はまったく異なります!
ニックコックス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.