従属変数の積の分散


31

従属変数の積の分散の式は何ですか?

独立変数の場合、式は単純です:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2
しかし、相関変数の式は何ですか?

ところで、統計データに基づいて相関関係を見つけるにはどうすればよいですか?

回答:


32

さて、あなたが指摘した身近なアイデンティティを使用して、

var(XY)=E(X2Y2)E(XY)2

共分散の類似式を使用して、

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

そして

E(XY)2=[cov(X,Y)+E(X)E(Y)]2

これは、一般に、var(XY)

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

独立の場合、あり、これはcov(X2,Y2)=cov(X,Y)=0

[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2

そして2つの項がキャンセルされ、[E(X)E(Y)]2

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

あなたが上で指摘したように。

編集:XYを別々に観察せずにだけを観察する場合、c o vX Y またはc o vX 2Y 2を推定する方法はないと思います特別な場合(たとえば、X Yにアプリオリに知られている手段がある場合)XYXYcov(X,Y)cov(X2,Y2)X,Y


2
なぜE(X2)E(Y2)の代わりに[var(X)+ E(X)2]⋅[var(Y)+ E(Y)2]を入れるのですか???

1
@ user35458なので、彼はvar(X)とvar(Y)の式として方程式になり、OPのステートメントに匹敵します。通知そのE(X ^ 2)= Varの(X)+ E(X)^ 2
Waldir Leoncio

2
この回答の有効性に対する削除された課題に(オフラインで)応答するために、多くのシミュレーションで結果を製品の分散の直接計算と比較しました。ある大きな用語を別の大きな用語から差し引く際にキャンセルすることでかなりの精度を失う可能性があるため、回避できる場合は使用する実用的な公式ではありませんが、それはポイントではありません。注意すべき1つの落とし穴は、この質問がランダム変数に関することです。 その結果は、n 1ではなくnの分母を使用して分散と共分散を計算するという条件でnn1データに適用されます(ソフトウェアでは通常)。
whuber

14

これは、2つの相関するランダム変数の積の分散を決定するために知っておく必要があることを正確に示す、@ Macroの非常に優れた答えの補遺です。var X Y 以来 wherecovXYE[X]E[Y]E

(1)var(XY)=E[(XY)2](E[XY])2=E[(XY)2](cov(X,Y)+E[X]E[Y])2(2)=E[X2Y2](cov(X,Y)+E[X]E[Y])2(3)=(cov(X2,Y2)+E[X2]E[Y2])(cov(X,Y)+E[X]E[Y])2
cov(X,Y)E[X]E[Y]、及び E [ Y 2 ] 量を既知であると仮定することができ、我々は、の値を決定することができる必要がある Eを[ X 2 Y 2 ]における2 または COV X 2Y 23 。これは一般的には簡単ではありませんが、すでに指摘したように、 X Y独立したランダム変数である場合、 cov X E[X2]E[Y2]E[X2Y2](2)cov(X2,Y2)(3)XY。実際、相関関係(またはその欠如)ではなく依存関係が重要な問題です。私たちはそのことを知っている COV X Yは等しい 0 の代わりに、いくつかの非ゼロの値は、しない、それ自体で、私たちの努力の中で最ものヘルプは、の値を決定している Eを[ X 2 Y 2 ]または COV X 2Yを2それにもかかわらず cov(X,Y)=cov(X2,Y2)=0cov(X,Y)0E[X2Y2]cov(X2,Y2)(2)(3)

XYE[X2Y2]

Suppose that X and Y are jointly normal random variables with correlation coefficient ρ. Then, conditioned on X=x, the conditional density of Y is a normal density with mean E[Y]+ρvar(Y)var(X)(xE[X]) and variance var(Y)(1ρ2). Thus,

E[X2Y2X]=X2E[Y2X]=X2[var(Y)(1ρ2)+(E[Y]+ρvar(Y)var(X)(XE[X]))2]
which is a quartic function of X, say g(X), and the Law of Iterated Expectation tells us that
(4)E[X2Y2]=E[E[X2Y2X]]=E[g(X)]
where the right side of (4) can be computed from knowledge of the 3rd and 4th moments of X -- standard results that can be found in many texts and reference books (meaning that I am too lazy to look them up and include them in this answer).

Further addendum: In a now-deleted answer, @Hydrologist gives the variance of XY as

(5)Var[xy]=(E[x])2Var[y]+(E[y])2Var[x]+2E[x]Cov[x,y2]+2E[y]Cov[x2,y]+2E[x]E[y]Cov[x,y]+Cov[x2,y2](Cov[x,y])2
and claims that this formula is from two papers published a half-century ago in JASA. This formula is an incorrect transcription of the results in the paper(s) cited by Hydrologist. Specifically, Cov[x2,y2] is a mistranscription of E[(xE[x])2(yE[y])2] in the journal article, and similarly for Cov[x2,y] and Cov[x,y2].

For the computation of E(X2Y2) in the joint normal case, also see math.stackexchange.com/questions/668641/…
Samuel Reid
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.