独立性がゼロ相関を意味するのはなぜですか?


16

まず第一に、私はこれを求めていません:

ゼロ相関が独立性を意味しないのはなぜですか?

これは(むしろうまく)ここ対処されてます:https : //math.stackexchange.com/questions/444408/why-does-zero-correlation-not-imply-independence

私が求めているのは逆です... 2つの変数は互いに完全に独立しています。

彼らは偶然にわずかな相関関係を持っていなかったのでしょうか?

そうではないはずです...独立は、非常に小さい相関を意味しますか?


5
独立変数でさえ、ほとんど常にゼロ以外のSAMPLE相関を持ちますが、おそらくほぼゼロに近いでしょう。
jsk

10
@jskが指摘したように、サンプルの相関関係と予想される相関関係を混同している可能性があります
David

1
@デビッドは説明できますか?私はまだ統計の初心者です。
ジョシュアロニス

3
@JoshuaRonisサンプル相関は、一連のデータを操作するときに観察する相関です。これを使用して、2つの変数間の「真の」相関関係を把握します。サンプルが大きいほど、推定値は高くなります。たとえば、2つのサイコロの結果の相関関係は独立しているため、相関関係はありません。10回一緒にロールしても、(ランダムな偶然により)相関関係が得られる場合がありますが、正または負の相関は優先されません(つまり、それぞれのチャンスが等しい)
David

1
だまされていないが関連する議論: 非ゼロの相関関係は依存関係を意味しますか?
SecretAgentMan

回答:


36

相関係数の定義により、2つの変数が独立している場合、それらの相関はゼロになります。したがって、偶然に相関関係が発生することはありませんでした!

ρバツY=E[バツY]E[バツ]E[Y]E[バツ2][E[バツ]]2 E[Y2][E[Y]]2

バツYが独立している場合、E[バツY]=E[バツ]E[Y]意味します。従って、分子のρバツYこの場合にはゼロです。

したがって、ここで述べたように、相関の意味を変えなければ、それは不可能です。場合を除き、相関関係から定義を明確にしてください。


2
それでも、海賊の数と全球平均気温との(逆)相関を明確に示すチャートがあります。他のコメントが指摘するように、一つは「偶然の外見」はもちろんのこと、サンプルサイズについて注意しなければならない
カール・Witthoft

@OmG「ここで述べたように、相関の意味を変更しない場合」OPの質問を読んだとき、「相関」の意味が大きく異なりました。私にとっては、「偶然にわずかな相関関係があるのではないでしょうか?」非常に強く測定」意味」の相関関係を、そしてあなたが現実の相関を測定するとき、あなたは非常に頻繁に見つけるだろう『』事故による相関のほんの少しを。
industry7

1
@ industry7なるほど。ただし、正式な方法で定義する必要があります。定性的であり、ここでは説明できません。
OmG

@CarlWitthoft海賊の数と世界の平均気温は独立していません。それらには、それらの間に依存関係を作成する共通の原因(つまり、時間、開発、近代化など)があります。「独立」は「引き起こさない」という意味ではありません。これは「関連付けられていない」ことを意味し、明らかにこれらのチャートは関連付けを示しています。
ノア

@ノア私はWHOOSHが起こったことを恐れています。 venganza.org
カール・ウィットフト

19

r=0。ρ]

n=51。

set.seed(616)
r = replicate( 10^6, cor(rexp(5), rexp(5))  )
mean(abs(r) > .5)
[1] 0.386212
mean(r)
[1] -0.0005904455

hist(r, prob=T, br=40, col="skyblue2")
  abline(v=c(-.5,.5), col="red", lwd=2)

ここに画像の説明を入力してください

5r=0.5716。

ここに画像の説明を入力してください

この点で指数分布について特別なことは何もありません。親分布を標準正規分布に変更すると、次の結果が得られました。

set.seed(2019)
...
mean(abs(r) > .5)
[1] 0.391061
mean(r)
[1] 1.43269e-05

ここに画像の説明を入力してください

n=20。

ここに画像の説明を入力してください

r


6
サンプルサイズが小さい場合、ゼロとは「顕著に」異なるサンプル相関を見つける可能性が高くなりますが、ゼロと有意に異なる相関を見つける可能性は低くなります。ポイントの推定値はゼロからはほど遠いものの、偶然以外の理由でゼロ以外の相関が見られると自信を持って主張するには、データが少なすぎます。わずか5対と、0.8より大きくても相関係数が0と有意に異ならないかもしれない
核王

11

簡単な答え:2つの変数が独立している場合、母集団の相関はゼロになりますが、サンプルの相関は通常は小さくなりますが、ゼロではありません。

これは、サンプルが母集団の完全な表現ではないためです。

サンプルが大きいほど、母集団をより適切に表すため、相関は小さくなります。ために無限のサンプル、相関はゼロであろう。


1
正確な定式化は、 p そして ϵ、いくつかあります n サンプルサイズが n、それから相関がより大きい確率 ϵ よりも少ない p
蓄積

はい、絶対に正しいです!私はできるだけシンプルで概念的な答えを維持しようとしました。
デイブ

1

これは、同じ直感的な理解を共有する一部の人々にとって役立つかもしれません。次のようなものを見てきました。

ここに画像の説明を入力してください

これらのデータはおそらく独立していますが、明らかに相関関係を示しています(r=0.66)。「独立はゼロ相関を意味すると思った!」学生は言います。

他の人がすでに指摘しているように、サンプル値は相関していますが、それは母集団が非ゼロ相関を持つことを意味しません。

もちろん、これら2つは独立している必要があります。ニコラスケイジが今年記録的な10本の映画に出演したとしても、安全のために夏に地元のプールを閉鎖するべきではありません。

しかし、今年何人がdrれるかを確認すると、記録的な1000人が今年drれる可能性がわずかにあります。

このような相関を取得することはほとんどありません。たぶん千人に一人。しかし、たとえ2つが独立していても可能です。しかし、これはほんの一例です。数百万の可能性のあるイベントを測定し、いくつかの2つのイベントが高い相関をもたらす可能性が非常に高いことを確認できます(そのため、上記のようなグラフの存在)。

別の見方をすると、2つの独立したイベントが常に無相関の値を与えることを保証すること自体が制限的です。2つの独立したサイコロと最初のサイコロの結果が与えられると、2番目のサイコロには特定の(かなりの)結果セットがあり、ゼロ以外の相関が得られます。最初のサイコロのロールが結果の分布に影響を与えているため、2番目のサイコロの結果を制限して最初のサイコロとの相関をゼロにすることは独立性の明らかな違反です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.