t検定を使用して、平均に違いがあるかどうかを評価できます。さまざまなサンプルサイズがt検定に問題を引き起こすことはなく、結果を特に注意して解釈する必要もありません。最終的に、単一の観測値を既知の分布と平均値およびSDを持つ無限母集団と比較することもできます。たとえば、IQが130の人は97.7%の人よりも賢いです。ただし、特定の(つまり、合計サンプルサイズ)に対して、グループが等しい場合にパワーが最大化されることに注意してください。非常に不均等なグループサイズでは、追加の観測ごとにそれほど多くの解像度は得られません。 nNn
電力に関する私のポイントを明確にするために、R向けに書かれた非常に単純なシミュレーションを以下に示します。
set.seed(9) # this makes the simulation exactly reproducible
power5050 = vector(length=10000) # these will store the p-values from each
power7525 = vector(length=10000) # simulated test to keep track of how many
power9010 = vector(length=10000) # are 'significant'
for(i in 1:10000){ # I run the following procedure 10k times
n1a = rnorm(50, mean=0, sd=1) # I'm drawing 2 samples of size 50 from 2 normal
n2a = rnorm(50, mean=.5, sd=1) # distributions w/ dif means, but equal SDs
n1b = rnorm(75, mean=0, sd=1) # this version has group sizes of 75 & 25
n2b = rnorm(25, mean=.5, sd=1)
n1c = rnorm(90, mean=0, sd=1) # this one has 90 & 10
n2c = rnorm(10, mean=.5, sd=1)
power5050[i] = t.test(n1a, n2a, var.equal=T)$p.value # here t-tests are run &
power7525[i] = t.test(n1b, n2b, var.equal=T)$p.value # the p-values are stored
power9010[i] = t.test(n1c, n2c, var.equal=T)$p.value # for each version
}
mean(power5050<.05) # this code counts how many of the p-values for
[1] 0.7019 # each of the versions are less than .05 &
mean(power7525<.05) # divides the number by 10k to compute the %
[1] 0.5648 # of times the results were 'significant'. That
mean(power9010<.05) # gives an estimate of the power
[1] 0.3261
n 1 = 50 n 2 = 50 n 1 = 75 n 2 = 25N= 100n1= 50n2= 50n1= 75n2= 25n1= 90n2= 10
これを類推して考えます。長方形の面積を知りたい場合で、境界が固定されている場合、長さと幅が等しい場合(つまり、長方形が正方形の場合)、面積は最大化されます。一方、長さと幅が異なると(長方形が長くなると)、領域が縮小します。