相関と共分散は、与えられた2つの変数間の線形関連性を測定し、他の形式の関連性を検出する義務はありません。
そのため、これらの2つの変数は他のいくつかの非線形の方法で関連付けられている可能性があり、共分散(したがって相関)は独立したケースと区別できません。
非常に教訓的、人工の非現実的な例として、一つは考えることができXようにP(X=x)=1/3のためにx=−1,0,1とも考えるY=X2。それらは関連付けられているだけでなく、一方が他方の機能であることに注意してください。それにもかかわらず、それらの共分散は共分散が検出できる関連に直交しているため、共分散は0です。
編集
実際、@ whuberで示されているように、上記の元の答えは実際には、両方の変数が必ずしも二分されていない場合、アサーションが普遍的に真ではない方法に関するコメントでした。私の悪い!
それでは、計算しましょう。(Barney Stinsonの「Suit up!」のローカル版)
具体的事例
両方の場合にXとY二分した、あなたは両方とも値のみと仮定することを、一般性を失うことなく、想定することができる0と1任意の確率でp、qおよびrで与えられる
P(X=1)=p∈[0,1]P(Y=1)=q∈[0,1]P(X=1,Y=1)=r∈[0,1],
完全の関節分布特徴付ける
X及び
Y。@DilipSarwateのヒントを取り上げると、
P (X = 0 、Y = 1 )なので、これらの3つの値で
共同分布を決定するのに十分であることに注意してください。
(X,Y)
(サイドノートでは、当然のことながら
、Rが両方尊重するためにバインドされている
Pは-R∈[0、1]、
Q-R∈[0、1]及び
1-P-Q-R∈[P(X=0,Y=1)P(X=1,Y=0)P(X=0,Y=0)=P(Y=1)−P(X=1,Y=1)=q−r=P(X=1)−P(X=1,Y=1)=p−r=1−P(X=0,Y=1)−P(X=1,Y=0)−P(X=1,Y=1)=1−(q−r)−(p−r)−r=1−p−q−r.
rp−r∈[0,1]q−r∈[0,1]を超え
R ∈ [ 0 、1 ]と言うことであり、
rは∈ [ 0 、分(P 、Q 、1 - P - Q )])。
1−p−q−r∈[0,1]r∈[0,1]r∈[0,min(p,q,1−p−q)]
ことを通知積に等しいかもしれないP ⋅ Q = P (X = 1 )P (Y = 1 )レンダリングなり、XとYのため、独立して
P (X = 0 、Y = 0 )r=P(X=1,Y=1)p⋅q=P(X=1)P(Y=1)XY
P(X=0,Y=0)P(X=1,Y=0)P(X=0,Y=1)=1−p−q−pq=(1−p)(1−q)=P(X=0)P(Y=0)=p−pq=p(1−q)=P(X=1)P(Y=0)=q−pq=(1−p)q=P(X=0)P(Y=1).
はい、等しいかもしれないのP 、Q、しかしそれは、それが上に境界を尊重するように、異なっていてもよいです。rpq
さて、上記の共同分布から、
E(X)E(Y)E(XY)Cov(X,Y)=0⋅P(X=0)+1⋅P(X=1)=P(X=1)=p=0⋅P(Y=0)+1⋅P(Y=1)=P(Y=1)=q=0⋅P(XY=0)+1⋅P(XY=1)=P(XY=1)=P(X=1,Y=1)=r=E(XY)−E(X)E(Y)=r−pq
Now, notice then that X and Y are independent if and only if Cov(X,Y)=0. Indeed, if X and Y are independent, then P(X=1,Y=1)=P(X=1)P(Y=1), which is to say r=pq. Therefore, Cov(X,Y)=r−pq=0; and, on the other hand, if Cov(X,Y)=0, then r−pq=0, which is to say r=pq. Therefore, X and Y are independent.
General Case
About the without loss of generality clause above, if X and Y were distributed otherwise, let's say, for a<b and c<d,
P(X=b)=pP(Y=d)=qP(X=b,Y=d)=r
then
X′ and
Y′ given by
X′=X−ab−aandY′=Y−cd−c
would be distributed just as characterized above, since
X=a⇔X′=0,X=b⇔X′=1,Y=c⇔Y′=0andY=d⇔Y′=1.
So
X and
Y are independent
if and only if X′ and
Y′ are independent.
Also, we would have
E(X′)E(Y′)E(X′Y′)Cov(X′,Y′)=E(X−ab−a)=E(X)−ab−a=E(Y−cd−c)=E(Y)−cd−c=E(X−ab−aY−cd−c)=E[(X−a)(Y−c)](b−a)(d−c)=E(XY−Xc−aY+ac)(b−a)(d−c)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)=E(X′Y′)−E(X′)E(Y′)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)−E(X)−ab−aE(Y)−cd−c=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)−a][E(Y)−c](b−a)(d−c)=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)E(Y)−cE(X)−aE(Y)+ac](b−a)(d−c)=E(XY)−E(X)E(Y)(b−a)(d−c)=1(b−a)(d−c)Cov(X,Y).
So
Cov(X,Y)=0 if and only Cov(X′,Y′)=0.
=D