離散関数:信頼区間カバレッジ?


9

離散間隔カバレッジを計算する方法は?

私が行う方法を知っています:

連続モデルがある場合、予測値ごとに95%の信頼区間を定義し、実際の値が信頼区間内にある頻度を確認できます。私の95%の信頼区間が実際の値をカバーしていたのは、88%の時間だけであることがわかります。

私がどうすればいいかわからない:

poissonやgamma-poissonなどの離散モデルでこれを行うにはどうすればよいですか?このモデルで私が持っているのは次のとおりです。単一の観測を行います(生成する予定の100,000以上のうち:)。

観察番号:(任意)

予測値:1.5

0の予測確率:.223

1の予測確率:.335

2の予測確率:.251

3の予測確率:.126

4の予測確率:.048

5の予測確率:.014 [および5以上は.019]

...(等)

100の予測確率(またはその他の非現実的な数値):.000

実際の値( "4"などの整数)

上記のポアソン値を指定しましたが、実際のモデルでは、予測値1.5は、観測ごとに0、1、... 100の異なる予測確率を持つ可能性があることに注意してください。

値の離散性に混乱しています。"5"は明らかに95%間隔の外にあります。これは、0.019が5以上で、0.025未満であるためです。しかし、4はたくさんあります-個別に4つありますが、4の数をより適切に共同で評価するにはどうすればよいですか?

なぜ気にするのですか?

私が調べているモデルは、集計レベルでは正確であるが、個々の予測が不十分であると批判されています。貧弱な個々の予測が、モデルによって予測された本質的に広い信頼区間よりもはるかに悪いことを知りたいです。経験的なカバレッジが悪化することを期待しています(たとえば、値の88%が95%の信頼区間内にあることがわかるかもしれません)が、少しだけ悪くなることを願っています。

回答:


6

ネイマンの信頼区間は、特定の区間の場合にパラメーターのカバレッジを提供しようとするものではありません。代わりに、長期的にはすべての可能なパラメーター値をカバーします。ある意味では、ローカルな精度を犠牲にして、グローバルに正確であるように努めます。

二項比率の信頼区間は、この問題を明確に示しています。間隔のナイマニアの評価は、次のような不規則なカバレッジプロットを生成します。これは、n = 10の二項試行の95%Clopper-Pearson間隔に対するものです。

Clopper-Pearsonカバレッジプロット

カバレッジを行うには別の方法があります。私は個人的にははるかに直感的に近づきやすく(したがって)便利だと思います。間隔によるカバレッジは、観測結果を条件として指定できます。そのカバレッジはローカルカバレッジになります。以下は、二項比率の信頼区間の3つの異なる計算方法の局所カバレッジを示すプロットです。

3種類の間隔の条件付きカバレッジ

95%のClopper-Pearson法では98%以上のローカルカバレッジが得られますが、正確な条件付き間隔は正確です。

グローバルインターバルとローカルインターバルの違いを考える方法は、グローバルをネイマンピアソン仮説検定の反転であると見なすことです。ここで、結果は、現在の長期エラー率の考慮に基づいて行われる決定です。実行される可能性のあるすべての実験のグローバルセットのメンバーとして実験します。ローカル間隔は、この特定の実験からのヌルに対する証拠を表すP値を生成するフィッシャーの有意差検定の反転に似ています。

(私が知る限り、グローバル統計とローカル統計の区別は、クレアFレスリー(1998)の未発表の修士論文で最初に行われました。信頼性の欠如:特に信頼区間の理論に関連する統計的推論。その論文はメルボルン大学のBaillieuライブラリーによって保持されています。)


2
私はクレアレスリーがグローバル/ローカルの区別を発明したとは思いませんが、彼女は多くの参照を付けて、それについて美しく詳細な説明をしました。私も彼女の論文を強く勧めます。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.