各グループで相関は重要ですが、全体では重要ではありませんか?


9

グループABの変数yの間のピアソン相関をテストするとします。それが可能であるX Y の相関の各々において有意であるAB両方のグループからのデータを組み合わせた場合が、非重要?この場合、その説明をお願いします。xyAB(x,y)AB

回答:


21

はい、それは可能であり、それはあらゆる種類の方法で発生する可能性があります。1つの明白な例は、xとyの値を反映する何らかの方法でAとBのメンバーシップが選択された場合です。他の例も可能です。たとえば、@ Macroのコメントは別の可能性を示唆しています。

Rで記述された以下の例を考えてみます。xとyはiidの標準の通常の変数ですが、xとyの相対値に基づいてそれらをグループに割り当てると、名前が付けられます。グループAとグループB内では、xとyの間に統計的に有意な強い相関がありますが、グループ化構造を無視すると、相関はありません。

ここに画像の説明を入力してください

> library(ggplot2)
> x <- rnorm(1000)
> y <- rnorm(1000)
> Group <- ifelse(x>y, "A", "B")
> cor.test(x,y)

        Pearson's product-moment correlation

data:  x and y 
t = -0.9832, df = 998, p-value = 0.3257
alternative hypothesis: true correlation is not equal to 0 
95 percent confidence interval:
 -0.09292  0.03094 
sample estimates:
     cor 
-0.03111 

> cor.test(x[Group=="A"], y[Group=="A"])

        Pearson's product-moment correlation

data:  x[Group == "A"] and y[Group == "A"] 
t = 11.93, df = 487, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0 
95 percent confidence interval:
 0.4040 0.5414 
sample estimates:
   cor 
0.4756 

> cor.test(x[Group=="B"], y[Group=="B"])

        Pearson's product-moment correlation

data:  x[Group == "B"] and y[Group == "B"] 
t = 9.974, df = 509, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0 
95 percent confidence interval:
 0.3292 0.4744 
sample estimates:
   cor 
0.4043 
> qplot(x,y, color=Group)

+1。これは私には思いつかなかった非常に賢い例です。
マクロ

13

1つの可能性としては、効果がグループごとに異なる方向に進み、それらを集約すると相殺される可能性があります。これは、回帰モデルで重要な交互作用項を省略したときに、主な効果が誤解を招く可能性がある方法にも関連しています。

Ayixi

E(yi|xi,Group A)=1+xi

B

E(yi|xi,Group B)=1xi

P(Group A)=1P(Group B)=p
E(yi|xi)

E(yi|xi)=E(E(yi|xi,Group))=p(1+xi)+(1p)(1xi)=p+pxi+1xip+pxi=1xi(2p1)

p=1/2E(yi|xi)=1xixiyi

p

注:通常のエラーでは、線形回帰係数の有意性はピアソンの相関の有意性と同等であるため、この例では、表示されている内容の1つの説明を強調しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.