0または1の二項推定値の信頼区間


36

推定値が(または同様にp = 1)であり、サンプルサイズが比較的小さい(n = 25など)場合、二項実験の信頼区間を計算するための最良の手法は何ですか?p=0p=1n=25


どのようにゼロに近いpは?それは頻繁にゼロですか、0.001、0.01、または...のオーダーですか?そして、あなたはどれくらいのデータを持っていますか?p^
jbowman

通常、800件を超える試行があります。私たちは通常、0〜0.1を期待したpp^
AI2.0

リンクしたClopper–Pearson間隔を使用します。一般原則:最初にClopper-Pearson間隔を試してください。コンピュータが答えを取得できない場合は、通常の近似などの近似方法を試してください。現在のコンピューターの速度によると、ほとんどの状況で近似が必要だとは思いません。
user158565

(1- 信頼レベルでの信頼区間の上限のみを取得するために、単にB(1 −α ; x + 1、n−x)を使用します。ここで、xは成功(または失敗)の数、nは。サンプルサイズのpythonでは、我々だけで使用。これがTRUEの場合は、我々は1 -であると結論付けることができαの上限は、我々はから計算した値によって制限されることを確信?ααscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x) αscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
AI2.0

1
800回の試行では、通常の正規近似は約まで合理的に機能します(私のシミュレーションでは、95%の信頼区間の94.5%の実際のカバレッジが示されました)。1000回の試行とp = 0.01で、実際のカバレッジは約92.7%でした(すべて100,000回の複製に基づいています。)これは、試行回数を考えると、非常に低いpの問題にすぎません。p=0.015p=0.01p
jbowman

回答:


53

通常の近似を使用しないでください

この問題について多くのことが書かれています。一般的なアドバイスをしていることはありません、ひどいカバレッジプロパティがあるため、通常の近似(漸近/ワルド信頼区間)を使用です。これを説明するためのRコード:

library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")

二項比率の漸近信頼区間のカバレッジ確率。

わずかな成功確率の場合、95%の信頼区間を要求するかもしれませんが、実際には、たとえば10%の信頼区間を取得します!

推奨事項

それで、何を使うべきでしょうか?私は現在の推奨事項は、紙に記載されているものと考えている二項割合を区間推定ではブラウン、カイとDasguptaさんによる統計学 2001年、巻。16、いいえ。2、101〜133ページ。著者は、信頼区間を計算するためのいくつかの方法を検討し、次の結論に達しました。

[W] eは、nが小さい場合はウィルソン間隔またはジェフリーズの等しいテールの事前間隔を、大きい場合はAgrestiおよびCoullで提案された間隔を推奨します場合ます。

ウィルソン区間は、 スコア検査の反転に基づいているためスコア区間ます。

間隔を計算する

これらの信頼区間を計算するには、このオンライン計算機またはR binom.confint()binomパッケージ内の関数を使用できます。たとえば、25回の試行で成功が0の場合、Rコードは次のようになります。

> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
  type="central")
         method x  n  mean  lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2         bayes 0 25 0.019  0.000 0.073
3        wilson 0 25 0.000  0.000 0.133

これbayesがジェフリーズの間隔です。(引数type="central"等しい尾を得るために必要です間隔を。)

前に 3つの方法のどれを使用するかを決定する必要があることに注意してください間隔を計算。3つすべてを見て最短を選択すると、当然ながらカバレッジの確率が小さすぎます。

迅速でおおよその答え

最後の注意点として、n回の試行で成功がまったくゼロであり、非常に迅速な近似信頼区間が必要な場合は、3ルールを使用できます。数字3をnで割るだけです。上記の例では、nは25であるため、上限は3/25 = 0.12です(下限はもちろん0です)。


あなたの答えをたくさん。この実際の例を想像してください。建築家は、天井の断熱パネルがすべて正しく取り付けられているかどうかを超高層ビルでテストする必要があります。ランダムに選択された床に25枚の天井パネルを開き、とりわけこれらの天井パネルの断熱材を見つけます。したがって、断熱パネルを持つ本当の確率は、ウィルソンスコア間隔に基づいてCI [0.867から1]の間で95%の確実性があると結論付けることができますか?
キャスパー14年

2
「95%の確実性」(「信頼区間の正しい解釈」についてはGoogle)で結論付けることができるとは言いません。また、これは、成功確率が等しい独立した試験の仮定に基づいていますが、ここでは現実的ではありません。おそらく、最後にインストールされたパネルは、誤ってインストールされるリスクが高くなりました(パネルをインストールする人が疲れたり退屈したりする)。あるいは、最初の人は、その人の経験が少なかったためかもしれません。とにかく、建築家がすべてのパネルが正しく設置されているかどうかをテストするように言われた場合、彼は単にサンプルをテストするのではなく、彼の仕事をするべきです!
カールオベハフハンマー14年

5
bayes両方の形状パラメーターが1の場合、(ジェフリーの代わりに)ユニフォームの優先順位を使用します。デフォルトとして均一な事前。したがって、結果が将来わずかに変化するかどうか疑問に思わないでください。
cbeleitesサポートモニカ

3
これは素晴らしい答えです。トピックに関する論文で読むことができるすべての重要な情報を、非常に簡潔かつ明確に伝えます。2回賛成票を投じることができた場合。
SigmaX

6
binconf方法Hmiscも、これらの間隔を計算します。デフォルトはウィルソン法です。
SigmaX

0

p±zα/2p(1p)/nπ0π0π0

|pπ0|p(1p)/n=0
(1+z02/n)π02+(2pz02/n)π0+p2=0


1
メモをありがとう。明確にしたいだけです: π0 は母集団で想定される失敗(または成功)率であり、pはサンプルから観測された失敗(または成功率)です。そして、nはサンプルサイズなので、おおよそのz値を解こうとしていますか?(ここにある基本的な前提は何ですか?)(Agressi(2007、pp.9-10)の論文にリンクしてくれませんか)。
AI2.0

はい、 π0 母集団パラメーターです。 p サンプルに基づくパラメーター推定値 nサンプルサイズです。この手順により、必要な重要なZ値が得られます。根底にある前提は、最後にリンクされているAgretsi and Coull(1998)で具体化されています。残念ながら、Agressi(2007)は教科書なので、リンクできません。 scholar.google.com/...
ジェイSchyler Raadt氏

それがアグレスティです。
ニックコックス

@NickCoxそれは別の仕事です
ジェイシラーラート

1
Alan Agrestiはさまざまなテキストを公開しています。ジョン・ワイリーのカテゴリー・データ分析入門(第2版2007;第3版は2018年10月の出版を予定しており、2019年の日付が付くかもしれません)をほのめかしていると思います。
ニックコックス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.