推定値が(または同様にp = 1)であり、サンプルサイズが比較的小さい(n = 25など)場合、二項実験の信頼区間を計算するための最良の手法は何ですか?
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
推定値が(または同様にp = 1)であり、サンプルサイズが比較的小さい(n = 25など)場合、二項実験の信頼区間を計算するための最良の手法は何ですか?
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
回答:
この問題について多くのことが書かれています。一般的なアドバイスをしていることはありません、ひどいカバレッジプロパティがあるため、通常の近似(漸近/ワルド信頼区間)を使用です。これを説明するためのRコード:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
わずかな成功確率の場合、95%の信頼区間を要求するかもしれませんが、実際には、たとえば10%の信頼区間を取得します!
それで、何を使うべきでしょうか?私は現在の推奨事項は、紙に記載されているものと考えている二項割合を区間推定ではブラウン、カイとDasguptaさんによる統計学 2001年、巻。16、いいえ。2、101〜133ページ。著者は、信頼区間を計算するためのいくつかの方法を検討し、次の結論に達しました。
[W] eは、nが小さい場合はウィルソン間隔またはジェフリーズの等しいテールの事前間隔を、大きい場合はAgrestiおよびCoullで提案された間隔を推奨します場合ます。
ウィルソン区間は、 スコア検査の反転に基づいているためスコア区間ます。
これらの信頼区間を計算するには、このオンライン計算機またはR binom.confint()
のbinom
パッケージ内の関数を使用できます。たとえば、25回の試行で成功が0の場合、Rコードは次のようになります。
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
これbayes
がジェフリーズの間隔です。(引数type="central"
は等しい尾を得るために必要です間隔を。)
前に 3つの方法のどれを使用するかを決定する必要があることに注意してください間隔を計算。3つすべてを見て最短を選択すると、当然ながらカバレッジの確率が小さすぎます。
最後の注意点として、n回の試行で成功がまったくゼロであり、非常に迅速な近似信頼区間が必要な場合は、3のルールを使用できます。数字3をnで割るだけです。上記の例では、nは25であるため、上限は3/25 = 0.12です(下限はもちろん0です)。
bayes
両方の形状パラメーターが1の場合、(ジェフリーの代わりに)ユニフォームの優先順位を使用します。デフォルトとして均一な事前。したがって、結果が将来わずかに変化するかどうか疑問に思わないでください。
binconf
方法Hmisc
も、これらの間隔を計算します。デフォルトはウィルソン法です。