対応のないt検定にはどのような正規性の仮定が必要ですか?そして、いつ彼らは会いますか?


12

対応のあるt検定を実施したい場合、要件は(正確に理解していれば)一致した測定単位間の平均差が正常に分布することです。

対応のあるt検定では、一致した測定単位間の差が正常に分布するという要求で明確にされます(2つの比較されたグループのそれぞれの分布が正常でない場合でも)。

ただし、対応のないt検定では、一致した単位の違いについて話すことはできません。そのため、2つのグループの観測値が正常であり、平均の差が正常になるようにする必要があります。それは私の質問に私を導きます:

2つの非正規分布が可能であるため、それらの平均の差が正規分布になりますか?(したがって、私が理解する限り、それらに対してペアのないt検定を実行するために必要な要件を満たしてください)

更新:(答えてくれてありがとう)私たちが探している一般的なルールは、平均の差は実際に正常であるということです。これは私にとって驚くべきことです(驚くことではなく、ただ驚くべきことです)、これがペアになっていないt検定でどのように機能するかについてですが、単一サンプルのt検定ではうまくいきません。以下に、いくつかのRコードを示します。

n1 <- 10
n2 <- 10
mean1 <- 50
mean2 <- 50
R <- 10000

# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
# hist(diffs)

P <- numeric(R)
MEAN <- numeric(R)
for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    y2 <- runif(n2, 0, 2*mean2)
    MEAN[i] <- mean(y1) - mean(y2)
    P[i] <- t.test(y1,y2)$p.value
}
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
par(mfrow = c(1,2))
hist(P)
qqplot(P, runif(R)); abline(0,1)
sum(P<.05) / R # for n1=n2=10 -> 0.0715 # wrong type I error, but only for small n1 and n2 (for larger ones, this effect disappears)



n1 <- 100
mean1 <- 50
R <- 10000
P_y1 <- numeric(R)

for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}

par(mfrow = c(1,2))
hist(P_y1)
qqplot(P_y1, runif(R)); abline(0,1)
sum(P_y1<.05) / R # for n1=n2=10 -> 0.057  # "wrong" type I error

ありがとう。


5
(Xi,Yi)XiFYi=Xi+Zi{Zi}N(0,σ2)

回答:


17

実際には、中央極限定理は、幅広い仮定の下で、テスト対象の2つのサンプル平均の分布が、サンプルサイズが大きくなるにつれて(これが仮定が入る場所)に関係なく正規分布に近づくことを保証します。基礎となるデータの分布。結果として、標本サイズが大きくなると、平均の差が正規分布になり、対応のないt検定のt統計量が名目t分布を持つために必要な要件が満たされます。したがって、より実際的に適用可能な質問は、統計の実際の分布とt分布の違いを安全に無視できるようになる前に、サンプルサイズがどれくらい大きくなければならないかです。

多くの場合、特に基礎となる分布が対称に非常に近い場合、答えは「それほど大きくない」です。たとえば、サンプルサイズ10の2つのUniform(0,1)分布の平均を比較する100,000テストをシミュレートし、95%の信頼レベルでテストした場合、実際には5.19%のnullを拒否しました-ほとんど違いはありません希望する公称5%の拒否率から(ただし、5%を超える標準偏差は約2.7です)

これが、基礎となる仮定が実際に満たされないあらゆる種類の状況で人々がt検定を使用する理由です。もちろん、問題の詳細に応じて走行距離は異なる場合があります。ただし、Wilcoxonテストなど、正規性を必要としない他のテストがあります。これは、データが正規分布している場合でも、漸近的にt検定と同じ約95%の効率です(つまり、サンプルサイズが必要です) Nが無限大になるにつれて、サンプルサイズがNのt検定と同じ検出力を持つN / 0.95 データが正規分布していない場合、t検定よりもはるかに優れている可能性があります(必ずしもそうであるとは限りません)。


6
私の経験では、必要なサンプルサイズtt

: -おかげでフランクあなたのコメントは私は近い私が後だものにある疑問明確に助けstats.stackexchange.com/questions/19681/...
タルGalili

1

もちろん。これが当てはまらない場合、独立サンプルt検定はあまり役に立ちません。ただし、2つの非正規母集団間の平均の差をテストするには、CLTにアピールする必要があるため、より大きなサンプルサイズが必要です。

簡単な例として、平均25の指数関数から派生した母集団1と、平均30の母集団2が均一に分布していると仮定します。異なるサンプルサイズも与えます。レプリケート関数を使用すると、Rを使用して、サンプル平均の差の分布がどのように見えるかを調べることができます。

n1 <- 30
n2 <- 25
mean1 <- 25
mean2 <- 30

diffs <- replicate(10000, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
hist(diffs)

サンプルサイズをいろいろ試してみると、サンプルサイズが小さいと実際には正規性が得られないことがわかりますが、サンプルサイズを増やすと、平均値の差に対してより正規のサンプリング分布が得られます。もちろん、この例で使用されている分布を変更してさらに調査することもできます。hist(diffs)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.