対 2項データから単一サンプルの電力分析を実行したいと思います。ここで、は母集団内の成功の割合です。場合、項の正規近似または -testのいずれかを使用できますが、場合、どちらも失敗します。この分析を行う方法があるかどうか知りたいです。提案、コメント、または参考資料をいただければ幸いです。どうもありがとう!H 1:P = 0.001 、P 0 < P < 1 χ 2、P = 0
対 2項データから単一サンプルの電力分析を実行したいと思います。ここで、は母集団内の成功の割合です。場合、項の正規近似または -testのいずれかを使用できますが、場合、どちらも失敗します。この分析を行う方法があるかどうか知りたいです。提案、コメント、または参考資料をいただければ幸いです。どうもありがとう!H 1:P = 0.001 、P 0 < P < 1 χ 2、P = 0
回答:
片側の正確な仮説があり、ここでおよびです。 p 1 = 0.001 p 0 = 0
Rの2番目のステップ:
> n <- 500 # sample size
> p1 <- 0.001 # success probability under alternative hypothesis
> cc <- 1 # threshold
> sum(dbinom(cc:n, n, p1)) # power: probability for cc or more successes given p1
[1] 0.3936211
サンプルサイズに応じて検出力がどのように変化するかを知るために、検出力関数を描くことができます。
nn <- 10:2000 # sample sizes
pow <- 1-pbinom(cc-1, nn, p1) # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)
少なくとも事前に指定された検出力を達成するために必要なサンプルサイズを知りたい場合は、上記で計算された検出力値を使用できます。少なくともパワーが必要だとします。
> powMin <- 0.5
> idx <- which.min(abs(pow-powMin)) # index for value closest to 0.5
> nn[idx] # sample size for that index
[1] 693
> pow[idx] # power for that sample size
[1] 0.5000998
したがって、累乗を達成するには、少なくともサンプルサイズが必要です。
pwr.p.test
、0.5の累乗の場合、少なくとも677の観測が必要です。しかし、パワー= 0.5は非常に低いです!
pwr.p.test()
正確な二項分布ではなく、正規近似を使用することに注意してください。入力pwr.p.test
するだけで、ソースコードを確認できます。pnorm()
近似が使用されていることを示す呼び出しが見つかります。
pwr
R のパッケージでこの質問に簡単に答えることができます。
有意水準、検出力、効果サイズを定義する必要があります。通常、有意水準は0.05に設定され、検出力は0.8に設定されます。より高い電力はより多くの観察を必要とします。有意水準が低いと、消費電力が減少します。
このパッケージで使用されるプロポーションのエフェクトサイズは、コーエンのhです。小さなhのカットオフは、多くの場合0.20と見なされます。実際のカットオフはアプリケーションによって異なり、場合によってはそれよりも小さくなることがあります。hが小さいほど、より多くの観測が必要になります。あなたはあなたの代替案がと述べました。とても小さい
> ES.h(.001, 0)
[1] 0.0632561
しかし、私たちはまだ先に進むことができます。
> pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)
proportion power calculation for binomial distribution (arcsine transformation)
h = 0.0632561
n = 1545.124
sig.level = 0.05
power = 0.8
alternative = greater
これらの値を使用するには、少なくとも1546の観測が必要です。
あなたの特定のケースでは、単純で正確な解決策があります:
特定の帰無仮説下では、成功を観察するべきではありません。したがって、1つの成功を観察するとすぐに、その確認できます。
代替少なくとも1つの成功を観察するために必要な試行回数は、幾何分布に従います。したがって、最小サンプルサイズを取得して累乗を達成するには、ような最小のkを見つける必要があります
そうで取得するあなたは、少なくとも1610個のサンプルを必要とするパワーを。