回答:
ŁukaszDeryłoの答えに追加するには、彼が書いているように、-150の共分散は負の関係を意味します。これが強い関係か弱い関係かは、変数の分散に依存します。以下に、強い関係の例(各個別の変数の分散は200であるため、共分散は分散と比較して絶対値で大きい)と、弱い関係の例(各分散は2000であるため、共分散は小さい)をプロットします、分散と比較して絶対的に)。
variance <- 200
:variance <- 2000
:library(MASS)
nn <- 100
epsilon <- 0.1
variance <- 2000 # weak relationship
opar <- par(mfrow=c(2,2))
for ( ii in 1:4 ) {
while ( TRUE ) {
dataset <- mvrnorm(n=100,mu=c(0,0),Sigma=rbind(c(2000,-150),c(-150,2000)))
if ( abs(cov(dataset)[1,2]-(-150)) < epsilon ) break
}
plot(dataset,pch=19,xlab="",ylab="",main=paste("Covariance:",cov(dataset)[1,2]))
}
par(opar)
whuberが指摘しているように、共分散自体は実際にはデータセットについて多くのことを教えてくれません。説明のために、Anscombeのカルテットを使用して、少し変更します。非常に異なる散布図がすべて同じ(丸められた)共分散-150を持つことができることに注意してください。
anscombe.mod <- anscombe
anscombe.mod[,c("x1","x2","x3","x4")] <- sqrt(150/5.5)*anscombe[,c("x1","x2","x3","x4")]
anscombe.mod[,c("y1","y2","y3","y4")] <- -sqrt(150/5.5)*anscombe[,c("y1","y2","y3","y4")]
opar <- par(mfrow=c(2,2))
with(anscombe.mod,plot(x1,y1,pch=19,main=paste("Covariance:",round(cov(x1,y1),0))))
with(anscombe.mod,plot(x2,y2,pch=19,main=paste("Covariance:",round(cov(x2,y2),0))))
with(anscombe.mod,plot(x3,y3,pch=19,main=paste("Covariance:",round(cov(x3,y3),0))))
with(anscombe.mod,plot(x4,y4,pch=19,main=paste("Covariance:",round(cov(x4,y4),0))))
par(opar)
最後に、ここに-150の共分散があり、と間でおそらく最も希薄な「負の関係」が考えられます。y
xx <- yy <- seq(0,100,by=10)
yy[9] <- -336.7
plot(xx,yy,pch=19,main=paste("Covariance:",cov(xx,yy)))
それは関係が否定的であることだけを教えてくれます。これは、1つの変数の低い値が他の高い値と一緒に発生する傾向があることを意味します。
(あなたの関係が強いか、弱い場合)ので、この共分散が大きいか小さいかどうか言うことは困難であるからの範囲に。したがって、変数の規模によって異なります。- S D (X )⋅ S D (Y )S D (X )⋅ S D (Y )
この関係が強いかどうかを判断するには、共分散を相関に変換する必要があります(除算)。これはから範囲であり、解釈に関する多くの異なるガイドラインがWebおよび教科書にあります。- 1 1
相関の有意性のテストも実行できます。