XとXYの相関


11

2つの独立したランダム変数XとYがある場合、Xと積XYの間にはどのような相関関係がありますか?これが不明な場合は、XとYの平均がゼロで正常であるという特定のケースで何が起こるかを理解することに興味があります。


4
この質問の動機は何ですか?ここで何か他のことにも取り組むのが最善だと思います。何らかの理由でXY変数を作成した調査を行っていますか?
ガン-モニカの回復

回答:


13

解決

有効な解決策は、変数と個別のプロパティの観点から相関を(可能であれば)表現するものであると考えます。相関の計算には、と単項式の共分散の計算が含まれます。これをすべて一度に実行すると経済的です。 単にそれを観察するXYXY

  1. ときにと独立しており、と力です、そしてと独立しています。XYijXiYj

  2. 独立変数の積の期待は、それらの期待の積です。

これにより、とモーメントに関する式が得られます。XY

これですべてです。


細部

瞬間については、などと書きます。したがって、計算が意味をなし、有限数を生成する任意の数について、μi(X)=E(Xi)i,j,k,l

Cov(XiYj,XkYl)=E(XiYjXkYl)E(XiYj)E(XkYl)=μi+k(X)μj+l(Y)μi(X)μk(X)μj(Y)μl(Y).

確率変数の分散はそれ自体との共分散であるため、分散について特別な計算を行う必要はありません。

これで、単数、任意のべき乗、有限数の独立確率変数を含むモーメントを計算する方法が明らかになります。アプリケーションとして、この結果を相関の定義に適用します。これは、共分散を分散の平方根で割ったものです。

Cor(X,XY)=Cov(X1Y0,X1Y1)Cov(X1Y0,X1Y0) Cov(X1Y1,X1Y1)=μ2(X)μ1(Y)μ1(X)2μ1(Y)(μ2(X)μ1(X)2)(μ2(X)μ2(Y)μ1(X)2μ2(Y)2).

これを元の変数の期待値、分散、および共分散に関連付ける場合に選択できるさまざまな代数的簡略化がありますが、ここでそれらを実行しても、それ以上の洞察は得られません。


14

総共分散の法則とおよび独立性を使用して、 総分散の法則を使用して、また独立性を使用して、 注意してくださいXY

Cov(X,XY)=ECov(X,XY|Y)+Cov(EX|Y,EXY|Y)=E(YCov(X,X))+Cov(EX,YEX)=E(YVarX)+Cov(EX,YEX)=EYVarX.
Var(XY)=EVar(XY|Y)+VarE(XY|Y)=E(Y2(VarX|Y))+Var(Y(EX|Y))=E(Y2VarX)+Var(YEX)=E(Y2)VarX+(EX)2VarY=VarXVarY+(EY)2VarX+(EX)2VarY.
Y 上記の内部の条件付き期待値、分散、または共分散のいずれかで定数として扱うことができます。

上記の共分散と分散から、いくつかの代数操作の後、相関は2つの変動係数でとしてうまく表現でき

corr(X,XY)=11+VarY(EY)2(1+(EX)2VarX).

シミュレーションによるこの結果のチェック:

> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373

いいですが、いくつかのことを親切に指摘したいと思います。1.方程式の2番目のセットの3行目に、ように括弧があるはず?2.質問をした人が、さまざまな手順の背後にある推論に従っていることを確信していますか?たとえば、は、が指定されているためです。一部の手順については最小限の説明をお勧めします。E(Y2VarX)+Var(YEX)ECov(X,XY|Y)=EYCov(X,X)Y
Antoni Parellada 2017

1
はい、欠けていた括弧と説明を追加しました。私は@whuberの答えを好むことを認めなければなりません。
Jarle Tufto 2017

5

XとYがゼロ平均の確率変数である特定の場合、ため。したがって、ρ(XY,X)=0E(X2Y)=E[E[X2Y|X]]=E[X2E[Y|X]]=0cov(XY,X)=E(X2Y)E(XY).E(X)=0


-2

XとXYの間の線形相関は、

Corr(X、XY)= Cov(X、XY)/ sqrt(var(X)* var(XY))

Cov(X、XY)= Summation((X-mean(X))(XY-mean(XY))/ n

n-サンプルサイズ。var(X)= Xの分散; var(XY)= XYの分散


1
問題はデータではなく、確率変数に関するものです。
whuber

2つの確率変数が相関しているかどうかをどのように確認できますか?データを通じてのみ。私が間違っていたら訂正してください。謝罪。
Sam Gladio 2017

確率変数の数学的特性を使用して、理論的に相関を計算します。これは、たとえば、ブリッジを構築してテストするのと比較して、ニュートン力学の原理を使用してブリッジ設計の強度を計算することとほとんど同じです。理論とデータには明確な役割があり、それらを互いに混同しないでください。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.