分散の線形性


16

次の2つの式が当てはまると思います。

V RX = 2 V RX

Var(aX)=a2Var(X)
に一定数である V RX + Y = V RX + V RY
Var(X+Y)=Var(X)+Var(Y)
場合、XX YはY独立しています

ただし、以下の何が問題なのかわかりません。

V a r2 X = V a rX + X = V a rX + V a rX

Var(2X)=Var(X+X)=Var(X)+Var(X)
これは 2 2 V a rX 22Var(X)に等しくない、すなわち 4 V a rX 4Var(X)

あるとするならば、XはX母集団から採取したサンプルで、私たちは常に想定することができると思いXがX他から独立しているようにXX、S。

それで私の混乱の何が悪いのでしょうか?


8
それがあった場合、あなたが持っていると思います(あなたの最初の文が示すこの-分散は線形ではないV R X = V R XをVar(aX)=aVar(X)一方、共分散がバイリニアである。。
バットマン

回答:


33

推論のラインの問題は

Xは常にX他のXから独立していると仮定できると思いますX。」

Xは、Xの独立していない XX。シンボル XXは、ここで同じランダム変数を参照するために使用されています。数式に表示される最初の Xの値がわかればX、2番目の Xの値も表示されるように修正さXれます。個別の(潜在的に独立した)ランダム変数を参照する場合は、異なる文字(例: XXおよび YY)または添え字(例: X 1X1および X 2X2)でそれらを示す必要があります。後者は、同じ分布から引き出された変数を示すためにしばしば使用されます(常にではありません)。

二つの変数場合はXYは、その後独立しているのPr X = A | Y = B と同じであるのPr X = A :の値を知るYは、私たちの価値に関する追加情報与えないXを。しかし、PrのX = | X = bがある1場合= B0の値を知ること:それ以外はXをXYPr(X=a|Y=b)Pr(X=a)YXPr(X=a|X=b)1a=b0XXの値に関する完全な情報を提供します。[この段落の確率を累積分布関数、または適切な場合は確率密度関数に置き換えて、本質的に同じ効果を得ることができます。]X

物事を見てのもう一つの方法は、ということである2つの変数が独立しているならば、彼らはゼロ相関を持っている(ただし、ゼロ相関は独立性を意味するものではありません!)が、Xがされて完全に自分自身と相関し、コアーX X = 1ので、Xは独立することはできませんそれ自体の。なお、以降の共分散は、で与えられる。CovをX Y = コアーX Y √をXCorr(X,X)=1XVAR X VAR Y 、次いでCovをXX=1Cov(X,Y)=Corr(X,Y)Var(X)Var(Y)
Var X 2 =VarX

Cov(X,X)=1Var(X)2=Var(X)

2つのランダム変数の合計の分散のより一般的な式は、

Var X + Y = Var X + Var Y + 2 Cov X Y

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

特に、Cov X X = Var X なので、Cov(X,X)=Var(X)

Var X + X = Var X + Var X + 2 Var X = 4 Var X

Var(X+X)=Var(X)+Var(X)+2Var(X)=4Var(X)

これは、ルールの適用から推測したものと同じです

Var a X = a 2 Var X Var 2 X = 4 Var X

Var(aX)=a2Var(X)Var(2X)=4Var(X)

線形性に興味があるなら、共分散の双線形性に興味があるかもしれません。ランダム変数WXY、およびZ(従属または独立)および定数abc、およびdについては、WXYZabcd

Cov a W + b X Y = a Cov W Y + b Cov X Y

Cov(aW+bX,Y)=aCov(W,Y)+bCov(X,Y)

Cov X c Y + d Z = c Cov X Y + d Cov X Z

Cov(X,cY+dZ)=cCov(X,Y)+dCov(X,Z)

そして全体的に、

Cov a W + b X c Y + d Z = a c Cov W Y + a d Cov W Z + b c Cov X Y + b d Cov X Z

Cov(aW+bX,cY+dZ)=acCov(W,Y)+adCov(W,Z)+bcCov(X,Y)+bdCov(X,Z)

次に、これを使用して、投稿で書いた分散の(非線形)結果を証明できます。

Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)

Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)

Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y)

Var(aX+bY)Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)=a2Var(X)+b2Var(Y)+2abCov(X,Y)

The latter gives, as a special case when a=b=1a=b=1,

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

When XX and YY are uncorrelated (which includes the case where they are independent), then this reduces to Var(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y). So if you want to manipulate variances in a "linear" way (which is often a nice way to work algebraically), then work with the covariances instead, and exploit their bilinearity.


1
Yes! I think you pinpointed at the beginning that the confusion was essentially a notational one. I found it very helpful when one book (very explicitly, some might say laboriously) explained the interpretation of and rules of evaluating a probabilistic statement (so that, e.g., even if you know what you mean by Pr(X+X=n)Pr(X+X=n) where XUniform(1..6)XUniform(1..6), it is technically incorrect if you're considering throwing a nn in craps (and X+X=2XX+X=2X would never yield an odd roll); the event would be properly expressed using X1,X2X1,X2 i.i.d.).
Vandermonde

1
This is in contrast to (and I think my misapprehension might have stemmed from) how 2+PRNG(6)+PRNG(6) often is how you would toss dice as above and/or notation/conventions such as 2d6=d6+d62d6=d6+d6 in which different instances are genuinely intended to be independent.
Vandermonde

@Vandermonde That's an interesting point. I initially considered mentioning the use of subscripts to distinguish between "different XXs" but didn't bother - think I might edit it in now. The argument that "you'd never get an odd total score if the sum was 2X2X" is very clear and convincing to someone who can't see the need to distinguish: thanks for sharing it.
Silverfish

0

Another way of thinking about it is that with random variables 2XX+X2XX+X.

2X2X would mean two times the value of the outcome of XX, while X+XX+X would mean two trials of XX. In other words, it's the difference between rolling a die once and doubling the result, vs rolling a die twice.


+1 This is a perfectly clear and correct answer. Welcome to our site!
whuber

Thanks @whuber!
Benjamin
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.