11
モデルが間違っているのに、なぜベイジアンである必要があるのですか?
編集:簡単な例を追加しました:平均の推論。また、信頼区間と一致しない信頼区間が悪い理由を少し明らかにしました。XiXiX_i かなり敬devなベイジアンの私は、ある種の信仰の危機の真っただ中にいます。 私の問題は次のとおりです。IIDデータを分析したいとします。私がやることは:XiXiX_i 最初に、条件付きモデルを提案します: p(X|θ)p(X|θ) p(X|\theta) 次に、上の前を選択し: P (θ )θθ\thetap(θ)p(θ) p(\theta) 最後に、ベイズの規則を適用し、事後を計算します:(または計算できない場合は近似)、についてのすべての質問に答えますθp(θ|X1…Xn)p(θ|X1…Xn)p(\theta | X_1 \dots X_n )θθ\theta これは賢明なアプローチです。データ真のモデルが条件付きの「内部」にある場合(値対応する場合)、統計的決定理論を呼び出して、メソッドが許容可能であると言うことができます(Robert詳細については「ベイジアン選択」、「統計のすべて」も関連する章で明確に説明しています)。θ 0をXiXiX_iθ0θ0\theta_0 しかし、誰もが知っているように、私のモデルが正しいと仮定することはかなり慢です。なぜ私が検討したモデルの箱の中に自然がきちんと収まるのでしょうか?これは、データの実際のモデルと仮定することははるかに現実的である異なりのすべての値に対して。これは通常、「誤って指定された」モデルと呼ばれます。p (X | θ )θptrue(X)ptrue(X)p_{true}(X)p(X|θ)p(X|θ)p(X|\theta)θθ\theta 私の問題は、このより現実的な誤って指定されたケースでは、単純に最尤推定量(MLE)を計算するのと比べて、ベイジアンであること(つまり、事後分布の計算)についての良い議論がないことです: θ^ML=argmaxθ[p(X1…Xn|θ)]θ^ML=argmaxθ[p(X1…Xn|θ)] \hat \theta_{ML} = \arg \max_\theta [ p(X_1 \dots X_n |\theta) ] 実際、Kleijn、vd Vaart(2012)によると、誤って指定された場合、事後分布は次のとおりです。 として、を中心とするディラック分布に収束しθ M Ln→∞n→∞n\rightarrow \infty θ^MLθ^ML\hat \theta_{ML} 事後の信頼できる区間が信頼区間に一致することを保証するために、正しい分散がありません(2つの値が偶然同じでない限り)。(信頼区間は明らかにベイジアンが過度に気にしないものですが、これは定性的には、事後分布が本質的に間違っていることを意味します。これは、信頼区間が正しいカバレッジを持たないことを意味します)θθ\theta したがって、追加のプロパティがない場合、計算プレミアム(一般にベイジアン推論はMLEよりも高価です)を支払います。 したがって、最後に、私の質問:モデルが誤って指定されている場合に、より単純なMLEの代替案に対してベイジアン推論を使用するための理論的または経験的な議論はありますか? (私の質問はしばしば不明瞭であることを知っているので、あなたが何かを理解しないならば、私に知らせてください:私はそれを言い換えようとします) 編集:簡単な例を考えてみましょう:ガウスモデルの下での平均を推測します(さらに単純化するために既知の分散を使用)。ガウス事前分布を考えます。事前平均、事前の逆分散でます。してみましょうの経験的な平均こと。最後に注意してください:。 …