回帰勾配を比較することでグループ間の相関を比較できますか?


10

この質問、彼らは(例えば、女性対男性のように)二つの独立したグループのためのピアソンrを比較する方法を尋ねます。返信とコメントは2つの方法を提案しました:

  1. rの「z変換」を使用して、フィッシャーのよく知られた式を使用します。
  2. 勾配の比較を使用します(回帰係数)。

後者は、飽和線形モデルを介して簡単に実行できます 。ここで、とは相関変数で、は2つのグループを示すダミー(0対1)変数です。(相互作用項係数)の大きさは、モデルが2つのグループで個別に実行され後の係数の差であり、その()の有意性は、グループ間の勾配の差の検定です。Y=a+bバツ+cG+dバツGバツYGdbY=a+bバツd

さて、勾配または回帰係数。まだ相関係数ではありません。しかし、我々は標準であればYを - 別に二つのグループに-そして、dは差に等しくなりますグループ1のRマイナスRグループ0で、したがって、その意義は、2つの相関の違いをテストします:我々しているテストの斜面が、相関関係をテストしているように見えます。バツYd

私が書いたのは正しいですか?

はいの場合、相関のより良いテストである質問が残っています-これは説明されたものですか、それともフィッシャーの質問ですか?それらは同じ結果をもたらさないからです。どう思いますか?

後で編集:@Wolfgangの返信に感謝しますが、フィッシャーのテストが上記の標準化された勾配の比較アプローチよりもrのテストの方が正しい理由を理解できないと思います。したがって、より多くの回答を歓迎します。ありがとうございました。

回答:


10

あなたが書いたすべてが正しいです。おもちゃの例でいつでもそのようなことをテストできます。以下はRの例です:

library(MASS)

rho <- .5  ### the true correlation in both groups

S1 <- matrix(c( 1,   rho,   rho, 1), nrow=2)
S2 <- matrix(c(16, 4*rho, 4*rho, 1), nrow=2)

cov2cor(S1)
cov2cor(S2)

xy1 <- mvrnorm(1000, mu=c(0,0), Sigma=S1)
xy2 <- mvrnorm(1000, mu=c(0,0), Sigma=S2)

x <- c(xy1[,1], xy2[,1])
y <- c(xy1[,2], xy2[,2])
group <- c(rep(0, 1000), rep(1, 1000))

summary(lm(y ~ x + group + x:group))

真の相関関係は両方のグループで同じですが、相互作用は非常に重要です。なぜそれが起こるのですか?2つのグループの生の回帰係数は、相関の強さだけでなく、2つのグループのX(およびY)のスケーリングも反映するためです。これらのスケーリングは異なるため、相互作用は重要です。これは重要なポイントです。相関の違いをテストするには、上記のモデルで相互作用をテストするだけでよいと考えられていることが多いためです。続けましょう:

summary(lm(xy2[,2] ~ xy2[,1]))$coef[2] - summary(lm(xy1[,2] ~ xy1[,1]))$coef[2]

これにより、2つのグループに別々に当てはめられたモデルの回帰係数の違いにより、交互作用項とまったく同じ値が得られることがわかります。

私たちが本当に興味を持っているのは、相関関係の違いです。

cor(xy1)[1,2]
cor(xy2)[1,2]
cor(xy2)[1,2] - cor(xy1)[1,2]

この違いは本質的にゼロであることがわかります。2つのグループ内で XとYを標準化して、モデル全体を再フィットさせます。

x <- c(scale(xy1[,1]), scale(xy2[,1]))
y <- c(scale(xy1[,2]), scale(xy2[,2]))
summary(lm(y ~ x + x:group - 1))

ここでは切片やグループの主効果は含まれていないことに注意してください。これらは定義上ゼロであるためです。xの係数はグループ1の相関に等しく、交互作用の係数は2つのグループの相関の差に等しいことがわかります。

ここで、Fisherのrからzへの変換を利用するテストを使用するよりも、このアプローチを使用する方が良いかどうかという質問に対して。

編集

ρ1=ρ2=0ρ1=ρ20α±1

結論:相関関係の違いをテストする場合は、フィッシャーのr-to-z変換を使用して、それらの値の違いをテストします。


フィッシャー変換は他のテストよりも優れていますか?
mark999 '07 / 08/11

私は少し速すぎました。私の編集を見てください。うまくいけば、あなたの質問に答えるはずです。
Wolfgang

つまり、@ Wolfgang、標準化の下での勾配の比較アプローチは、rの有効な比較であると考えています。フィッシャーの有名な代替案は、実際にはその近似です。私はあなたを正しく理解しましたか?
ttnphns 2011

私の編集を見てください。私の最初の結論は速すぎました。
Wolfgang

@Wolfgang、後で追加された返信の編集は、フィッシャーの方が優れていると述べています。「標準化の下の勾配の比較」アプローチは、「標準化エラー...標準化するとき...この標準化を考慮しない」ため、不適切です。標準化を考慮に入れて、標準化されていない勾配の比較アプローチがフィッシャーのテストと同じくらい有効になるように、彼らが標準化をどのように考慮すべきか説明してください。
ttnphns 2011
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.