3つのランダム変数の相関の限界


28

x、y、zの 3つのランダム変数がありますx,y,z。3つの変数間の3つの相関は同じです。あれは、

ρ=cor(x,y)=cor(x,z)=cor(y,z)

\ rhoに与えることができる最も厳しい限界は何ρですか?


1
おそらく「pho」とは、rhoρ)を意味します。しかし、あなたの質問は明確ではありません。「あなたが与えることができる最も厳しい限界は何ですか」とはどういう意味ですか?
グング-モニカの復職

さて、変数の名前は単なるダミーです。最強の限界とは、相関の[-1、1]のようなものを意味しますが、これは明らかに可能な限り厳密な限界ではありません。
user1352399

rho = cor(x、y)= cor(x、z)= cor(y、z)という意味ですか?rhoの制限は何ですか?
user31264

はい、rho = cor(x、y)= cor(x、z)= cor(y、z)であり、rhoの限界は何ですか。Dilip、それを拡張してrhoは非負、つまり0以上でなければならない、と言うことができますか?
user1352399

1
これを引用する教科書は、Seber&Lee "Linear Regression Analysis"(少なくとも初版では...)
kjetil b halvorsen

回答:


29

共通の相関ρ値は+1-1ではありません1。もしρX,Y=ρX,Z=1、次にρY,Z等しくできない1が、実際には+1。3つの確率変数の共通相関の最小値は12です。より一般的には、n確率変数の最小共通相関は1n1 、ベクトルと見なされると、n次元空間の(次元n1)シンプレックスの頂点にあります。n

単位分散の確率変数合計の分散を考え ます。我々はそれが持っている ここでは平均値のの相関係数。しかし、以来、我々は容易に取得する ことを X i var n i = 1 X i nXi ˉ ρ N

var(i=1nXi)=i=1nvar(Xi)+i=1njincov(Xi,Xj)=n+i=1njinρXi,Xj(1)=n+n(n1)ρ¯
ρ¯ VARΣIX、I01 ˉ ρ-1(n2)var(iXi)0(1)
ρ¯1n1.

したがって、相関係数の平均値は 少なくとも です。場合、すべての相関係数を有する同じ値、次いで、それらの平均も等しくと我々は持っているので 共通の相関値等しいランダム変数を持つことは可能ですか?はい。が無相関の 単位分散ランダム変数であり、を設定 すると仮定し。次に、、一方 ρΣIYiは=0N-1nと1n1ρρ - 1ρρ-1

ρ1n1.
ρ XiYi=Xi11n1Xi E[YI]=0VARYI=N - 1Yi=Xi1nj=1nXj=XiX¯E[Yi]=0 covYiYj=2n1
var(Yi)=(n1n)2+(n1)(1n)2=n1n
および 与え したがって、はの最小共通相関値を達成するランダム変数です。メモ、なお、その 、及びので、ベクトルとみなし、確率変数を内にあるの次元超平面 ρYIY用J=COVYIYのJ
cov(Yi,Yj)=2(n1n)(1n)+(n2)(1n)2=1n
Yi1
ρYi,Yj=cov(Yi,Yj)var(Yi)var(Yj)=1/n(n1)/n=1n1.
Yi1n1iYi=0(n1)n次元空間。

25

可能な限り厳しい境界はです。1/2ρ1 そのような値はすべて実際に表示される可能性があり、不可能なものはありません。

結果について特に深いまたは神秘的なものは何もないことを示すために、この答えは最初に完全な初歩的な解決策を提示します。これに続いて、一般的な解決策が行われます(わずかに洗練された代数的事実を使用します)。

基本的な解決策

線形結合の分散は非負でなければなりません。x,y,z これらの変数の分散をそれぞれおよびとします。すべてはゼロ以外です(そうでないと、相関の一部が定義されません)。分散の基本的な特性を使用して、計算することができますυ 2σ2,τ2,υ2

0Var(αx/σ+βy/τ+γz/υ)=α2+β2+γ2+2ρ(αβ+βγ+γα)

すべての実数について。(α,β,γ)

仮定すると、少し代数的な操作はこれがα+β+γ0

ρ1ρ13((α2+β2+γ2)/3(α+β+γ)/3)2.

右側の2乗項は、の2つのべき平均の比です。基本電力平均不等式(重みを有する)その比を超えることができないアサート(と等しくなるたとき)。もう少し代数は1 / 3 1 / 3 1 / 3 1 1 α = β = γ 0(α,β,γ)(1/3,1/3,1/3)11α=β=γ0

ρ1/2.

以下のの明示的な例(変量正規変数)は、そのような値すべてが実際に相関として生じることを示しています。この例では、多変量法線の定義のみを使用しますが、それ以外の場合は微積分または線形代数の結果を呼び出しません。X Y Z - 1 / 2 ρ 1n=3(x,y,z)1/2ρ1

一般的な解決策

概要

すべての相関行列は、すべての相関行列と同様に、標準化されたランダム変数の共分散行列であり、半正定でなければなりません。同様に、その固有値は負ではありません。これは単純な条件を課します:より小さくてはいけません(もちろん超えることはできません)。逆に、そのような実際にはいくつかの三変量分布の相関行列に対応し、これらの境界が可能な限り厳密であることを証明します。- 1 / 2 1 ρρ1/21ρ


の条件の導出ρ

検討によって全ての非対角値との相関行列に等しい(質問はの場合に関するものですが、この一般化は分析するのが難しくありません。)それをと呼びましょう 定義により、は、次のような非ゼロのベクトルが存在する場合の固有値です。のn ρ N = 3 Cρ N λ X λnnρ.n=3,C(ρ,n).λxλ

C(ρ,n)xλ=λxλ.

これらの固有値は、このケースでは簡単に見つけることができます。

  1. まかせ、コンピュートその1=(1,1,,1)

    C(ρ,n)1=(1+(n1)ρ)1.
  2. まかせとでのみための場所()、それを計算する1 J 番目 J=23...n個yj=(1,0,,0,1,0,,0)1jthj=2,3,,n

    C(ρ,n)yj=(1ρ)yj.

これまでに見つかった固有ベクトルは、次元空間全体に及ぶため(証拠:行の簡約により、がゼロ以外の行列式の絶対値を示す)、すべての固有ベクトルの基礎を構成します。したがって、すべての固有値を見つけ、それらがまたは(多重度後者あると判断しました。すべての相関によって満たされる既知の不等式に加えて、最初の固有値の非負性はさらに意味します、N 、N 1 + N - 1 ρ 1 - ρ N - 1 - 1 ρ 1nnn1+(n1)ρ1ρn11ρ1

ρ1n1

一方、2番目の固有値の非負性は新しい条件を課しません。


条件の十分性の証明

含意は両方向に機能します:、行列は非負定であり、したがって有効な相関行列です。たとえば、多重正規分布の相関行列です。具体的には、Cρ N 1/(n1)ρ1,C(ρ,n)

Σ(ρ,n)=(1+(n1)ρ)Inρ(1ρ)(1+(n1)ρ)11

場合のの逆数の場合たとえば、場合- 1 /N - 1 < ρ < 1 のn = 3C(ρ,n)1/(n1)<ρ<1.n=3

Σ(ρ,3)=1(1ρ)(1+2ρ)(ρ+1ρρρρ+1ρρρρ+1).

確率変数のベクトルに分布関数を持たせる(X1,X2,,Xn)

fρ,n(x)=exp(12xΣ(ρ,n)x)(2π)n/2((1ρ)n1(1+(n1)ρ))1/2

ここで、。たとえば、場合、これは次と等しくなります。x=(x1,x2,,xn)n=3

12π31ρ21+2ρexp1+ρバツ2+y2+z22ρバツy+yz+zバツ21ρ1+2ρ

これらのランダム変数の相関行列はnCρn

図

密度関数輪郭 左から、。密度が平面付近に集中している状態から、線付近に集中している状態にどのようにシフトするかに注意してください。fρ3ρ=4/1004/108/10バツ+y+z=0バツ=y=z

特殊なケースおよびは、縮退分布によっても実現できます。前者の場合、分布は超平面でサポートされていると考えることができることを指摘する以外は、詳細には触れません正規分布。後者の場合(完全な正の相関)、によって生成されるラインでサポートされます。平均正規分布を持ちます。ρ=1/n1ρ=1バツ1=0010


非縮退の詳細

この分析のレビューにより、相関行列のランクはあり、のランクは明らかです。(一方のみ固有ベクトルが非ゼロ固有値を有するため)。以下のために、これはいずれの場合も相関行列縮退を行います。そうでない場合、その逆の存在は、それが非縮退であることを証明します。C1/n1nn1C1n1n2Σρn


20

あなたの相関行列は

1ρρρ1ρρρ1

主要な主要マイナーがすべて非負である場合、行列は半正定です。主要な未成年者は、行列の「北西」ブロックの行列式、つまり1の行列式です。

1ρρ1

相関行列自体の行列式。

1は明らかに正であり、2番目の主マイナーはであり、許容される相関に対して非負です。相関行列全体の行列式は1ρ2ρ[11]

2ρ33ρ2+1。

プロットは、許容可能な相関範囲にわたる関数の行列式を示しています。 [11]ここに画像の説明を入力してください

関数は、@ stochazesthaiで指定された範囲で負ではありません(行列式の根を見つけることで確認できます)。


あなたの答えでと仮定していませんか?なぜできますか?Var=1
海の老人。

1
@Anold「相関」が書かれている「共分散」を読んでいるようです。
whuber

6

相関行列が正の半正である場合にのみ、ペアワイズ相関を持つランダム変数、、が存在しますこれはます。Y Z ρ X Y = ρ Y Z = ρ X Z = ρ ρ [ - 1バツYZρバツY=ρYZ=ρバツZ=ρρ[121]


2
これを非常に簡単な言葉で説明できますか。
エリザベススーザンジョセフ

1
行列代数の知識を必要としない説明は存在しないと思います。ウィキペディアのページ(en.wikipedia.org/wiki/…)をご覧になることをお勧めします。
stochazesthai

4
私は基本的な(高校レベルの)代数のみを必要とする説明を見つけ、それを私の答えに含めました。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.