「実際のカバレッジ確率」の計算は、「信頼できる間隔」の計算と同じですか?


9

エントリーレベルの統計教科書を読んでいました。二項分布を持つデータの成功率の最尤推定に関する章では、信頼区間を計算するための式を提供し、さりげなく言及しました

実際のカバレッジ確率、つまり、メソッドが真のパラメーター値を取得する間隔を生成する確率を考慮してください。これは、公称値よりもかなり少ない場合があります。

そして、おそらく実際のカバレッジ確率を含む代替の「信頼区間」を構築する提案を続けます。

私は初めて、名目確率と実際のカバレッジ確率の考えに直面しました。ここで古い質問を通り抜けると、理解できたと思います。確率と呼ばれる2つの異なる概念があります。1つ目は、まだ起こっていないイベントが特定の結果を生成する確率であり、2つ目は確率です。既に発生したイベントの結果に対する監視エージェントの推測が真である可能性がどのくらいあるかです。また、信頼区間は最初のタイプの確率のみを測定し、「信頼できる区間」と呼ばれるものは2番目のタイプの確率を測定するように見えました。要約すると、信頼区間は「公称カバレッジ確率」を計算するものであり、信頼区間は「実際のカバレッジ確率」をカバーするものであると仮定しました。

しかし、本を誤って解釈した可能性があります(それが提供する異なる計算方法が信頼区間と信頼区間、または2つの異なるタイプの信頼区間に対するものであるかどうかは完全に明確ではありません)。私の現在の理解。特に私が別の質問で得たコメント、

頻度主義者の信頼区間、ベイジアンにとって信頼できる

その本はその章でベイジアン法を説明していなかったので、私は私の結論を疑いました。

ですから、私の理解が正しいかどうか、または途中で論理的な誤りを犯したかどうかを明確にしてください。


n

回答:


4

一般に、離散分布で作業している場合、実際のカバレッジ確率は名目確率と等しくなることはありません。

n+1pp

CLTに基づく方法は、公称値を下回るカバレッジ確率を持つことは一般的に当てはまりますが、他の方法は実際にはより保守的です。


1
Ω,F,Pθ1α LU:ΩR
P[{ωΩ|[L(ω),U(ω)]θ}]1α.
coverage probabilityΩ

8

ππ=π1π=π2π

xnπ

xπUPr(X=x|π=0.7)I(πU0.7)00.39303780.000729010.58180340.010206020.72866160.059535130.84683890.185220140.93715010.324135150.99148760.302526161.00000000.1176491
x 95%πU=π:[Pr(X>x|π)=0.95]π=0.7xこの仮定の下で; 4番目は、計算された信頼区間が真のパラメーター値をカバーするケースを示し、それらにフラグを立てます。信頼区間が真の値をカバーする場合の確率をすると、実際のカバレッジが得られます。真の値が異なると、実際のカバレッジは異なります。10.989065π

報道

公称カバレッジは、真のパラメーター値が取得可能な上限と一致する場合にのみ達成されます。

[私はあなたの質問を読み直しましたが、実際には名目カバレッジ確率よりも低い可能性があると著者が言っていることに気付きました。だから私は彼らが信頼区間を計算するためのおおよその方法について話していると思いますが、私が上で言ったことはまだ行きます。グラフは、平均信頼レベルを約と報告することを提案するかもしれませんが、不明なパラメーターの値を平均化しますか?]98%

†正確な実際の適用範囲は、以下の任意の値の公称カバレッジよりも決してありませんという意味で、&のいくつかの値のためにそれに等しい - Unwisdomの感覚@、いないステファンさん@。ππ

upperもちろん、上限と下限のある間隔がより一般的に使用されます。しかし、説明するのがもう少し複雑であり、上限だけを考慮すれば、正確な間隔は1つしかありません。(参照Blaker(2000年)、「信頼曲線と離散分布のための改善された正確な信頼区間」、カナダ統計学会誌28、4&参照。)


答えてくれてありがとう。実際のカバレッジ確率がわかったところで、この質問のユーザーが信頼区間と信頼区間の違いを説明する質問に送られた理由を推測していますか?これは私が実際/名目カバレッジ確率が高いという考えを得た場所です。二元性は関連しています。 stats.stackexchange.com/questions/63922/...
rumtscho

おそらく、OPは「名義」および「実際」という用語が見られる場所へのリンクを提供するだけであるため(おそらく、質問の中で要約したり引用したりするのではなく)、残りの質問を彼の誤解に費やします。そのコンテキストで使用します。
Scortchi-モニカの回復

1

違いは、実際には信頼区間を計算するときに行われる近似の使用に関するものだと思います。たとえば、かなり標準的なCIを使用する場合

estimate±1.96×estimated standard error

これを「95%信頼区間」と呼ぶことがあります。ただし、通常、ここではいくつかの近似が行われます。近似を行わない場合は、実際のカバレッジを計算できます。典型的な状況は、標準誤差の推定中です。次に、間隔が狭すぎて、95%の確率で真の値を取得できません。彼らは、例えば85%の確率で真の値をキャプチャするだけかもしれません。「実際のカバレッジ」確率は、ある種のモンテカルロシミュレーションを使用して計算できます(たとえば、選択した真の値を使用してサンプルデータセットを生成し、それぞれについて95%のCIを計算して、実際に真の値を含んでいることを確認します)。1000850

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.