AとBがCと相関している場合、なぜAとBは必ずしも相関しないのですか?


62

私は経験的にそれが事実であることを知っています。この難問にぶつかるモデルを開発しました。また、必ずしもyes / noの答えではないのではないかと思います。つまり、AとBの両方がCと相関している場合、これはAとBの間の相関に関して何らかの意味を持つかもしれません。しかし、この意味は弱いかもしれません。それは単なる標識の方向であり、他には何もないかもしれません。

これが私が意味することです... AとBの両方がCと0.5の相関関係を持っているとしましょう。それを考えると、AとBの間の相関関係は1.0になります。0.5またはそれ以下になることもあると思います。しかし、マイナスになる可能性は低いと思います。それに同意しますか?

また、標準のピアソン相関係数を検討している場合、または代わりにスピアマン(ランク)相関係数を検討している場合、影響はありますか?私の最近の経験的観測は、スピアマン相関係数に関連付けられていました。


38
例は、B = Y、およびC = X + Yを使用することです。XYを独立させることができますが、ABの両方がCと(正に、ピアソン)相関しています。A=XB=YC=X+YXYABC

1
おかげで、それは実際に素晴らしいコメントです。短いですが、それがそうである理由の本質を捉えています。
Sympa

回答:


53

相関は多変量分布の数学的特性であるため、それらの分布の統計的起源に関係なく、純粋に計算によって洞察を得ることができます。

ピアソン相関、考慮多変量変数 YZを。これらは非負定行列は実際にはいくつかの多重正規分布の共分散行列であり、それによって存在の問題を解決するため、これらは動作するのに役立ちます。対角が1の行列に固執すると、共分散行列の非対角要素は相関になります。相関書き込みX及びYとしてρの相関Y及びZのようにτ、との相関XおよびZとしてXYZ1XYρYZτXZを計算しますσ

  • (これは、相関行列の行列であり、それは負であることができないため)。1+2ρστ(ρ2+σ2+τ2)0

  • 場合これはことを意味ρ 2 + τ 21。別の言い方をすれば、ρτの両方が大きけれXZは非ゼロの相関を持たなければなりませんσ=0ρ2+τ21ρτXZ

  • もし、その後の任意の非負値σ(の間の01コースの)が可能です。ρ2=τ2=1/2σ01

  • 場合、負の値σが許容されています。場合、例えば、ρ = τ = 1 / 2σはどこの間であることができる- 1 / 2及び1ρ2+τ2<1σρ=τ=1/2σ1/21

これらの考慮事項は、相互相関に実際にいくつかの制約があることを意味します。制約(相関行列の非負の定義のみに依存し、変数の実際の分布には依存しません)は、単変量分布に関する仮定に応じて厳しくすることができます。たとえば、Yの分布が同じロケーションスケールファミリにない場合、それらの相関は厳密にサイズが1未満でなければならないことを簡単に確認(および証明)できます。(証明:± 1の相関関係は、XYが線形に関連していることを意味します)XY1±1XY

限りスピアマンの順位相関が行く、3つの変量の観測を検討2 3 1 、及び3 2 3 X Y Z 。それらの相互の順位相関は1 / 21 / 2、および- 1 / 2。したがって、ランク相関の符号でも(1,1,2)(2,3,1)(3,2,3)(X,Y,Z)1/21/21/2 Zは、 X Yおよび X Zの相関の符号の逆になります。YZXYXZ


whuber、「多重正規変数」とは何ですか?
Sympa


いつものように、最も徹底的な説明には、当然のことながら「ベストアンサー」チェックマークが付いています。
Sympaの

@Gaetan Lionあなたはとても親切です。私はこの質問に対するすべての答えを読んで楽しんでいます(そしてそれらをすべてマークアップしました)。
whuber

88

私は今、毎年恒例の釣り旅行にいます。私が釣りをする時間と釣った魚の量の間には相関関係があります。また、使用する餌のサイズと釣った魚の量にも相関があります。餌の大きさと時刻の間に相関関係はありません。


バジル、大好き!わかりやすい英語の説明については、+ 1。
Sympaの

ベスト。回答。stats.stackexchangeで。今まで
クリスビーリー

1
これは、最初は相関が低い場合について説明していますが、相関が高い場合については説明していません。時刻と80%の相関があり、餌のサイズと80%の相関がある場合、日中はより大きな餌を使用していることを保証できます!
user35581

2
@ user35581いいえ、できません。要点をすべて逃しています。1時間ごとに、小さな餌で1回、大きな餌で1回釣りをすることができました。1日の特定の部分でより多くの魚を捕まえることができ(80%の相関)、より大きな餌でより多くの魚を捕まえることができ(80%の相関)、使用している餌のサイズと時刻の間に0の相関があります。悪い時間を補うために、オフピーク時に頻繁に大きな餌を使用すると、負の相関関係になる可能性もあります。したがって、時刻と餌の大きさの相関関係については何も知りません。
-rysqui

2
@rysqui申し訳ありませんが、私のコメントは不十分な言葉遣いでしたが、私がやろうとしていたポイントはこれでした:機能とターゲットの間の相関が非常に高くなるとき、あなたの機能も同様に相関しなければなりません。したがって、時刻と漁獲量の間に完全な相関関係があり、餌のサイズと漁獲物のサイズの間に完全な相関関係がある場合は、餌のサイズと時刻の間に完全な相関関係もなければなりません。 「日中はより大きな餌を使用しています」。これはエッジケースであることに注意してください!
user35581


18

whuberの答えのアドオンとして:提示された式

1+2ρστ(ρ2+σ2+τ2)0

次の不等式に変換できます(Olkin、1981):

στ(1σ2)(1τ2)ρστ+(1σ2)(1τ2)

ρ

ここに画像の説明を入力してください


オルキン、I。(1981)。積モーメント相関行列の範囲制限。Psychometrika、46、469-472。土井:10.1007 / BF02293804


これらの例のいくつかが、コンポーネント間の可能な相関の範囲を制限する特定の周辺分布を持つ多変量分布であるかどうかを教えてもらえますか?つまり、相関関係は-1から1までの全範囲をとることができないことを意味します。フレシェは1950年代にこれを開発した少なくとも1人であったことを思い出します。今日文学を検索するとき、私はそれらが現在フレシェコピュラと呼ばれていると思います。
マイケルチャーニック

14

「なぜそれらを相関させるべきなのか」と尋ねた方が良いと思います。または、「特定の相関関係があるのはなぜですか?」

次のRコードは、x1とx2が両方ともYと相関しているが、互いに0の相関がある場合を示しています

x1 <- rnorm(100)
x2  <- rnorm(100)
y <- 3*x1 + 2*x2 + rnorm(100, 0, .3)

cor(x1,y)
cor(x2,y)
cor(x1,x2)

Yとの相関は、.3を.1に減らすか、または何にでも強くすることができます


残念ながら、私はRユーザーではありません。したがって、上記のコードは、私にとってあなたよりも意味が少ないです。
Sympa

2
x1x2y=3x1+2x2yx1x2

14

統計的デモンストレーションは、私よりも適している人に任せます...しかし、イベントAは、イベントCの生成に寄与するプロセスXを生成すると直感的に言います。一方、BはYを生成し、これもCを形成します。したがって、AはCと相関し、BはCと相関しますが、AとBは相関しません。


1
@ニース。最後の文の最後の部分で「AとBは相関していない」という意味だと思います。
suncoolsu

はい、ニコはsuncoolsuを修正しました...これはかなり良い説明です。パス分析について部分的に説明しています。
Sympa

はい、ごめんなさい、私は手紙と混同してしまいました;)
nico

1

直観が必要な人にとって、相関関係はある角度の余弦と見なすことができます。したがって、3Dの3つのベクトル、A、B、Cを考えてみましょう。それぞれが1つの変数に対応します。問題は、AとBの間の角度とBとCの間の角度がわかっている場合に、AとCの間の可能な角度の範囲を決定することです。そのために、ソフトウェアをインストールせずにオンラインツールで遊ぶことができます。http://www.montefiore.ulg.ac.be/~pierard/chained_correlations.phpページにアクセスするだけです


0

一例を見てみましょう。

A={x1,x2,x3,x4,x5,x6,x7,x8,x9}

B={x1,x2,x3,0,0,0,0,0,0}

C={0,0,0,x4,x5,x6,0,0,0}

一部のxでは、AとBに有意な相関があり、同様にAとCにも有意な相関がありますが、BとCの相関は有意ではありません。

したがって、AとBが相関し、AとCが相関している場合、BとCも相関しているとは限りません。

注:理解を深めるために、この例を大規模データで考えてください。


BCx1x6ABCx1x9

最終的にはすべてが他のすべてとある程度相関しているため、Abhishek Anandの回答に満足しています。そして、私は彼が統計的有意性の観点からベンチマークする方法が好きです。このフレームワークを使用すると、AとBがCと統計的に有意に相関している場合、AまたはBが必ずしも統計的に有意に相関しているとは限りません(元の質問の実際のフレームワークを使用)。ベント図は、その概念の優れた視覚的説明に役立つと思います。
-Sympa

@whuber私はあなたに同意します。なぜその必要はない、説明し、その一つだけのサンプル例
アビシェークアナンド

それは問題ありませんが、これらのベクトル間の相関関係について誤解しているようです。 なしあなたはこれらのベクトルの相関係数について作る声明のは、一般的に正しいません。
whuberの
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.