帰無仮説がある場合の二項データの検出力分析

対 2項データから単一サンプルの電力分析を実行したいと思います。ここで、は母集団内の成功の割合です。場合、項の正規近似または -testのいずれかを使用できますが、場合、どちらも失敗します。この分析を行う方法があるかどうか知りたいです。提案、コメント、または参考資料をいただければ幸いです。どうもありがとう！ $H_0: p = 0$ $H_1: p = 0.001$ $p$ $0 < p <1$ $\chi^2$ $p =0$

— user765195
ソース

それでは、正確なClopper-Pearson検定を使用しないのはなぜですか。

— ステファン・ローラン

あなたが本当に大きなサンプルを持っていることを願っています！これはテストするのが難しいでしょう。

— ピーターフロム-モニカの復活

回答:

片側の正確な仮説があり、ここでおよびです。 $p_{1} > p_{0}$ $p_{1} = 0.001$ $p_{0} = 0$

最初のステップは、成功数のしきい値を特定することです。これにより、サイズサンプルで少なくとも成功が得られる確率は、帰無仮説（通常、）で非常に低くなります。あなたの場合、と特定の選択に関係なく、です。 $c$ $c$ $n$ $\alpha = 0.05$ $c=1$ $n \geqslant 1$ $\alpha > 0$
2番目のステップは、対立仮説の下でサイズサンプルで少なくとも成功する確率を見つけることです。これがあなたの力です。ここでは、二項分布が完全に指定されるように、固定のが必要です。 $c$ $n$ $n$ $\mathcal{B}(n, p_{1})$

Rの2番目のステップ： $n = 500$

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

サンプルサイズに応じて検出力がどのように変化するかを知るために、検出力関数を描くことができます。ここに画像の説明を入力してください

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

少なくとも事前に指定された検出力を達成するために必要なサンプルサイズを知りたい場合は、上記で計算された検出力値を使用できます。少なくともパワーが必要だとします。 $0.5$

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

したがって、累乗を達成するには、少なくともサンプルサイズが必要です。 $693$ $0.5$

— カラカル
ソース

によるとpwr.p.test、0.5の累乗の場合、少なくとも677の観測が必要です。しかし、パワー= 0.5は非常に低いです！

— ジェシカ

@カラカルあなたはあなたのパワーカーブを得るために通常の近似を使用していますか？正確な2項べき乗関数はそれほど滑らかではありません。これは実際には鋸歯状であり、サンプルサイズの軸が拡大されているかどうかを確認できます。これについては、Christine Liuと共著したアメリカ統計学者の2002年の論文で議論しています。また、2項式は非常に低いpで非常に歪んでいるため、通常の近似が適切に機能するには、nが大きくなければなりません。

— Michael R. Chernick

@MichaelChernickいいえ、これは正規近似からではなく、二項分布からのものです。もちろん、2項式検定の検出力は、単調ではないのこぎり波関数であるというのは正しいことです。ただし、ここでは特別なケースがあることに注意してください。つまり、対立仮説の受け入れ領域は、に関係なく常に1から始まります。定数しきい値、定数場合、電力は厳密に増加する関数です。

p_{0} = 0

$p_{0} = 0$

n

$n$

c = 1

$c = 1$

p_{1} = 0.001

$p_{1} = 0.001$

n

$n$

— カラカル2012年

@Jessica pwr.p.test()正確な二項分布ではなく、正規近似を使用することに注意してください。入力pwr.p.testするだけで、ソースコードを確認できます。pnorm()近似が使用されていることを示す呼び出しが見つかります。

— カラカル2012年

@caracalだから私はそれをこのように見ることができます：帰無仮説の下で成功の確率は0なので、成功を目にしたことがあれば帰無仮説を拒否できます。二項合計が1になると、タイプ2のエラー0で拒否できるため、しきい値は1であると言います。今度は代替案の下で、n番目の試行の最初の成功の確率は（1-p） pです。nが無限大になると、この確率は0になります。したがって、S = 1のときに停止する順次ルールは、p> 0に対して1のべき乗になります。

^{n}

$^n$

^{-}

$^-$

^{1}

$^1$

_{n}

$_n$

— Michael R. Chernick

pwrR のパッケージでこの質問に簡単に答えることができます。

有意水準、検出力、効果サイズを定義する必要があります。通常、有意水準は0.05に設定され、検出力は0.8に設定されます。より高い電力はより多くの観察を必要とします。有意水準が低いと、消費電力が減少します。

このパッケージで使用されるプロポーションのエフェクトサイズは、コーエンのhです。小さなhのカットオフは、多くの場合0.20と見なされます。実際のカットオフはアプリケーションによって異なり、場合によってはそれよりも小さくなることがあります。hが小さいほど、より多くの観測が必要になります。あなたはあなたの代替案がと述べました。とても小さい $p = 0.001$

> ES.h(.001, 0)
[1] 0.0632561

しかし、私たちはまだ先に進むことができます。

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

これらの値を使用するには、少なくとも1546の観測が必要です。

— ジェシカ
ソース

あなたの特定のケースでは、単純で正確な解決策があります：

特定の帰無仮説下では、成功を観察するべきではありません。したがって、1つの成功を観察するとすぐに、その確認できます。 $H_0: p=0$ $p\neq0$

代替少なくとも1つの成功を観察するために必要な試行回数は、幾何分布に従います。したがって、最小サンプルサイズを取得して累乗を達成するには、ような最小のkを見つける必要があります $H_1: p=0.001$ $1-\beta$

1 - β \leq 1 - (1 - p)^{(k - 1)}

$1-\beta \leq 1-(1-p)^{(k-1)}$

そうで取得するあなたは、少なくとも1610個のサンプルを必要とするパワーを。 $p=0.001$ $80%$

— 浮く
ソース

ソリューション1のコメントを読んで、これは本質的に答えに固執した場合に得られるものと同じソリューションであることがわかりました。それにもかかわらず、いくつかの基本的な確率理論の結果を説明することは、直感によってそこに到達する必要がなければ、決して害を及ぼしません。

— フロート