離散間隔カバレッジを計算する方法は?
私が行う方法を知っています:
連続モデルがある場合、予測値ごとに95%の信頼区間を定義し、実際の値が信頼区間内にある頻度を確認できます。私の95%の信頼区間が実際の値をカバーしていたのは、88%の時間だけであることがわかります。
私がどうすればいいかわからない:
poissonやgamma-poissonなどの離散モデルでこれを行うにはどうすればよいですか?このモデルで私が持っているのは次のとおりです。単一の観測を行います(生成する予定の100,000以上のうち:)。
観察番号:(任意)
予測値:1.5
0の予測確率:.223
1の予測確率:.335
2の予測確率:.251
3の予測確率:.126
4の予測確率:.048
5の予測確率:.014 [および5以上は.019]
...(等)
100の予測確率(またはその他の非現実的な数値):.000
実際の値( "4"などの整数)
上記のポアソン値を指定しましたが、実際のモデルでは、予測値1.5は、観測ごとに0、1、... 100の異なる予測確率を持つ可能性があることに注意してください。
値の離散性に混乱しています。"5"は明らかに95%間隔の外にあります。これは、0.019が5以上で、0.025未満であるためです。しかし、4はたくさんあります-個別に4つありますが、4の数をより適切に共同で評価するにはどうすればよいですか?
なぜ気にするのですか?
私が調べているモデルは、集計レベルでは正確であるが、個々の予測が不十分であると批判されています。貧弱な個々の予測が、モデルによって予測された本質的に広い信頼区間よりもはるかに悪いことを知りたいです。経験的なカバレッジが悪化することを期待しています(たとえば、値の88%が95%の信頼区間内にあることがわかるかもしれません)が、少しだけ悪くなることを願っています。