TL; dr
は、混合された4次モーメントの特別な条件が満たされた場合のみ、サンプル共分散の非対角要素は、通常、対角要素と相関します。場合二変量ガウス分布である、これらの条件は、ときにのみ保持無関係である。E(XY3)− E(XY)E(Y2)= 0(X、Y)バツY
細部
限界分布をサンプル共分散(CLTにより、多変量正規になる)で調べ、デルタ法を適用することにより、ここに示すことができる漸近的な結果があります。これは残念ながら、サンプルの共分散分布の導出を迂回する必要があることを意味します。オンラインで適切な参照を見つけることができないためです。あるいは、正規性を仮定しても構わない場合は、ウィシャート分布の共分散の知識があれば、セクション2に直接スキップできます。ん−−√1
1サンプルの共分散の漸近分布
LET二変量分布からIIDサンプルである有限の4次モーメントと、およびlet
一般性を失わずに、煩わしい追加の簿記を避けるために、と仮定します
。 V1、… 、VんV私= (バツ私Y私)Cov (V私)= (σ2ρ στρ σττ2) =Σが。
E(V私)= 0
次に、期待値の線形性と大きな数の弱い法則により、サンプルの共分散
は不偏で一貫しています、そして実際には
Sん=1n − 1Σi = 1ん(V私−V¯ん)(V私−V¯ん)T=1n − 1Σi = 1V私VT私−んn − 1V¯んV¯Tん
Σん−−√(Sん- Σ )→dN(0 、Λ )。
したがって、演習は決定に移ります Λ。対称行列の場合A =(abbc)、させて あ〜= (a 、b 、c)T上三角の「ベクトル化」である。ここで、主要な項(散布図行列)に入る平均の単一要素を考えます。Sん:
Z〜私=V私VT私〜=⎛⎝⎜バツ2私バツ私Y私Y2私⎞⎠⎟。
明らかにゼロ平均の仮定により、すでに E(Z私)=Σ〜 そしての力を考慮することによって バツ そして Y に現れる Z〜私Z〜T私 私たちはただ書くことができます
Cov (Z〜私)= E(Z〜私Z〜T私)− E(Z〜私)E(Z〜私)T=⎛⎝⎜κ40σ4κ31σ2τκ22σ2τ2κ31σ2τκ22σ2τ2κ13στ3κ22σ2τ2κ13στ3κ04τ4⎞⎠⎟−Σ〜Σ〜T。
ここに κ私はj= E[(バツ私σ)私(Y私τ)j]
を示します 私はj混合された標準化されたモーメント(平均についてですが、最初は平均ゼロと仮定しました)。
あるいは、因数分解があります
Cov (Z〜私)= D (σ、τ)[ K− R (ρ )R (ρ)T] D (σ、τ)、(1 )
どこ D (σ、τ)= diag (σ2、στ、τ2)、 R (ρ )= (1 、ρ 、1)T そして
K=⎛⎝⎜κ04κ31κ22κ31κ22κ13κ22κ13κ04⎞⎠⎟。
したがって、 Z11 そして Z12の標本分散を表す バツ との共分散 バツ、Y 相関しない限り ρ =κ31。いつV私 多変量正規です。これは次の場合にのみ発生します ρ = 0。
2相関係数
今、変革を考えて g(x 、y、z)= (x 、yz√バツ√) オン Sん〜。これは、サンプル相関係数の2変量分布とxのサンプル分散を提供します。デルタ法と漸近正規性Sん、
ん−−√(g(Sん〜)− (ρ 、σ2)T)→ N(0 、J(Σ〜)TΛ〜J(Σ〜))、
どこ J(Σ〜)= [ ∇gT1、∇gT2]T のヤコビアンです g。
私は(おそらくあなたは私の代数をチェックしたいと思うかもしれませんが…) g です
∇g2(σ2、ρ στ、τ2)=( −ρ2σ2、1στ、−ρ2τ2)T、
そう
J(σ、ρ 、τ)=⎛⎝⎜⎜100−ρ2σ21στ−ρ2τ2⎞⎠⎟⎟。
式(1)の因数分解とすべてまとめると、
J(σ、ρ 、τ)TD (σ、τ)[K− R (ρ )R (ρ)T] D (σ、τ)J(σ、ρ 、τ)。
使いやすい数字を差し込む、と言うσ= τ= 1 そして ρ = .5、私たちは
J(σ、ρ 、τ)TD (σ、τ)[ K− R (ρ )R (ρ)T] D (σ、τ)J(σ、ρ 、τ)= (- 1 / 4110- 1 / 40)I Ω I⎛⎝⎜- 1 / 41- 1 / 4100⎞⎠⎟= Q、
どこ Ω = K− R (ρ )R (ρ)T一般的に、いくつかの密な行列です。Mathematicaの厚意により、この製品をK と以下に再カウント Q12
n ×Q12= n × Cov (r 、s2バツ)=κ31−κ04+κ224(2 )
これは混合モーメントに関しては不透明な表現ですが、一般的にはゼロになるとは思えません。
3通常のケースに特化
イッサリスの定理は、ガウスの混合モーメントを導き出す方法を提供します。再び仮定σ= τ= 1 そして ρ = .5、私たちは持っているだろう
κ31= 3 / 2 、κ04= 3 、κ22= 3 / 2したがって、
Q12= 3 / 2 - (3 + 3 / 2 )/ 4 = 3 / 8 > 0、あなたが観察するように。
4シミュレーションと例
シミュレーション検証式(1)を以下に示します。ためにn = 100 そして n = 1000 (それぞれ赤と青で)多変量正規からのiid観測、私はの共分散を導きます ん−−√S〜んブートストラップによって。間の共分散Sx y そして Sx x y軸にプロットされます ρ 異なる − .9 に .9。式(1)からの理論値と、2変量ガウスの4次モーメントに関する事実を使用すると、黒い破線でプロットされます。
楽しい練習は、任意の値のコピュラの家族を見つけることを試みることです ρ レンダリングする Cov (Sx y、Sx x)= 0...
library(mvtnorm)
library(tidyverse)
library(boot)
params = expand.grid(sx = 1, sy = 1, n = c(100, 1000), rho = seq(-.9, .9, by = .1), replicate = 1:10) %>% mutate(k04 = 3*sx^4, k31 = 3*sx*rho*sx*sy, q12 = k31 - rho*sx*sy)
Sn_tilde = function(dat, idx){
Sn = cov(dat[idx,,drop =FALSE])*sqrt(length(idx))
Sn[upper.tri(Sn, diag = TRUE)]
}
out = params %>% group_by_all() %>% do({
x = with(., rmvnorm(n = .$n, sigma = matrix(c(sx^2, rho*sx*sy,
rho*sx*sy, sy^2), nrow = 2)))
colnames(x) = c('X', 'Y')
b = boot(x, Sn_tilde, R = 500)
cov_Sn = cov(b$t)
rownames(cov_Sn) = colnames(cov_Sn) = c('Sxx', 'Sxy', 'Syy')
as_tibble(cov_Sn, rownames = 'j')
})
ggplot(filter(out, j == 'Sxx'), aes(x = rho, y = Sxy, color = factor(n))) + geom_point(size = .5, alpha = .5) + geom_smooth(method = 'lm') + geom_line(data = filter(params, replicate == 1, n == 100), aes(y = q12), lty = 2, color = 'black') + theme_minimal() + ylab('Cov(Sxy, Sxx)')
1 これは、確率と数学的統計に関するMichael Perlmanの講義ノートを多用しています。これは、電子的に利用できるようにして、私の消耗品が消耗したときに交換できるようにしたいです...