ボトムライン
真の(ピアソン)相関係数がゼロであるという仮説を棄却するために必要なサンプル相関係数は、サンプルサイズが大きくなるにつれて非常に速く小さくなります。したがって、一般的に、いいえ、大きな(大きさで)相関係数と同時に大きな値を同時に持つことはできませんp。
トップライン (詳細)
関数のピアソン相関係数に使用されるテストは、以下で説明する方法をわずかに修正したバージョンです。Rcor.test
仮定相関を持つIID変量正規ランダムベクトルで。対という帰無仮説をテストします。してみましょうサンプルの相関係数も。標準線形回帰理論を使用すると、検定統計量
にがあることを示すことは難しくありません。
帰無仮説の下の分布。大きい、分布は標準正規に近づきます。したがって、ρ ρ = 0 ρ ≠ 0 、R T = R √(X1、Y1)、(X2、Y2)、… 、(Xn、Yn)ρρ = 0ρ ≠ 0r TのN-2NT、N-2T2T2〜F1、N-2χ21
T= r n − 2−−−−−√(1 − r2)−−−−−−√
tn − 2ntn − 2T2は、1自由度でほぼカイ二乗分布です。(我々が行った仮定の下では、実際にはですが、近似により、何が起こっているかがより明確になると思います。)
T2〜F1 、n − 2χ21
したがって、
ここでは、1自由度のカイ2乗分布の分位数です。Q 1 - α(1 - α )
P (r21 - r2(N - 2 )≥ Q1 - α) ≈α、
q1 - α(1 - α )
今、なお、のように増加している増加します。確率ステートメントで数量を並べ替えると、すべての
レベルで帰無仮説の棄却が得られます。明らかに右側はとともに減少します。r 2 | r | ≥ 1r2/(1− r2)r2 αN
| r | ≥ 11 + (n − 2 )/ q1 - α−−−−−−−−−−−−−√
αn
計画
これは、棄却域のプロットですサンプルサイズの関数として。したがって、たとえば、サンプルサイズが100を超える場合、レベルでnullを拒否するには、(絶対)相関関係は約0.2でです。α = 0.05| r |α = 0.05
シミュレーション
簡単なシミュレーションを実行して、正確な相関係数を持つゼロ平均ベクトルのペアを生成できます。以下はコードです。これから、の出力を見ることができますcor.test
。
k <- 100
n <- 4*k
# Correlation that gives an approximate p-value of 0.05
# Change 0.05 to some other desired p-value to get a different curve
pval <- 0.05
qval <- qchisq(pval,1,lower.tail=F)
rho <- 1/sqrt(1+(n-2)/qval)
# Zero-mean orthogonal basis vectors
b1 <- rep(c(1,-1),n/2)
b2 <- rep(c(1,1,-1,-1),n/4)
# Construct x and y vectors with mean zero and an empirical
# correlation of *exactly* rho
x <- b1
y <- rho * b1 + sqrt(1-rho^2) * b2
# Do test
ctst <- cor.test(x,y)
コメントで要求されているように、ここにプロットを再現するコードがあります。これは上記のコードの直後に実行できます(そこで定義された変数の一部を使用します)。
png("cortest.png", height=600, width=600)
m <- 3:1000
yy <- 1/sqrt(1+(m-2)/qval)
plot(m, yy, type="l", lwd=3, ylim=c(0,1),
xlab="sample size", ylab="correlation")
polygon( c(m[1],m,rev(m)[1]), c(1,yy,1), col="lightblue2", border=NA)
lines(m,yy,lwd=2)
text(500, 0.5, "p < 0.05", cex=1.5 )
dev.off()