編集:簡単な例を追加しました:平均の推論。また、信頼区間と一致しない信頼区間が悪い理由を少し明らかにしました。
かなり敬devなベイジアンの私は、ある種の信仰の危機の真っただ中にいます。
私の問題は次のとおりです。IIDデータを分析したいとします。私がやることは:
最初に、条件付きモデルを提案します:
次に、上の前を選択し: P (θ )
最後に、ベイズの規則を適用し、事後を計算します:(または計算できない場合は近似)、についてのすべての質問に答えますθ
これは賢明なアプローチです。データ真のモデルが条件付きの「内部」にある場合(値対応する場合)、統計的決定理論を呼び出して、メソッドが許容可能であると言うことができます(Robert詳細については「ベイジアン選択」、「統計のすべて」も関連する章で明確に説明しています)。θ 0を
しかし、誰もが知っているように、私のモデルが正しいと仮定することはかなり慢です。なぜ私が検討したモデルの箱の中に自然がきちんと収まるのでしょうか?これは、データの実際のモデルと仮定することははるかに現実的である異なりのすべての値に対して。これは通常、「誤って指定された」モデルと呼ばれます。p (X | θ )θ
私の問題は、このより現実的な誤って指定されたケースでは、単純に最尤推定量(MLE)を計算するのと比べて、ベイジアンであること(つまり、事後分布の計算)についての良い議論がないことです:
実際、Kleijn、vd Vaart(2012)によると、誤って指定された場合、事後分布は次のとおりです。
として、を中心とするディラック分布に収束しθ M L
事後の信頼できる区間が信頼区間に一致することを保証するために、正しい分散がありません(2つの値が偶然同じでない限り)。(信頼区間は明らかにベイジアンが過度に気にしないものですが、これは定性的には、事後分布が本質的に間違っていることを意味します。これは、信頼区間が正しいカバレッジを持たないことを意味します)
したがって、追加のプロパティがない場合、計算プレミアム(一般にベイジアン推論はMLEよりも高価です)を支払います。
したがって、最後に、私の質問:モデルが誤って指定されている場合に、より単純なMLEの代替案に対してベイジアン推論を使用するための理論的または経験的な議論はありますか?
(私の質問はしばしば不明瞭であることを知っているので、あなたが何かを理解しないならば、私に知らせてください:私はそれを言い換えようとします)
編集:簡単な例を考えてみましょう:ガウスモデルの下での平均を推測します(さらに単純化するために既知の分散を使用)。ガウス事前分布を考えます。事前平均、事前の逆分散でます。してみましょうの経験的な平均こと。最後に注意してください:。 σ μ 0 β 0をˉ X X I μ = (β 0 μ 0 + N
事後分布は次のとおりです。
正しく指定された場合(実際にガウス分布を持っている場合)、この事後には次の素晴らしいプロパティがあります
が共有モデルが事前分布から選択される階層モデルから生成される場合、事後信頼区間は正確なカバレッジを持ちます。データに条件付きで、が任意の間隔にある確率は、事後がこの間隔に帰する確率に等しい θ
事前分布が正しくない場合でも、信頼できる間隔は、後方への事前の影響がなくなる限界で正しいカバレッジを持ちます。
事後はさらに良好な周波数特性を持ちます:事後から構築されたベイズ推定量はすべて許容可能であることが保証され、事後平均は(Cramer-Raoの意味で)平均の効率的な推定量であり、信頼できる間隔は漸近的に信頼区間です。
誤って指定された場合、これらのプロパティのほとんどは理論によって保証されません。アイデアを修正するために、実際のモデルは、学生分布であると仮定しましょう。保証できる唯一の特性(Kleijn et al)は、事後分布が限界実平均に集中することです。一般に、すべてのカバレッジプロパティは消滅します。さらに悪いことに、その限界では、カバレッジプロパティが根本的に間違っていることを保証できます。事後分布は、空間のさまざまな領域に間違った確率を帰します。X i n → ∞