1.限界尤度および調和平均推定量
周辺尤度は、事後分布の正規化定数として定義されています
p (x)= ∫Θp (x | θ )p (θ )dθ 。
この量の重要性は、ベイズ因子を介したモデル比較で果たす役割に由来します。
この量を概算するためのいくつかの方法が提案されています。Raftery et al。(2007)Harmonic mean estimatorを提案してください。アイデアは、関係を使用して構成されています
1p (x)= ∫Θp (θ | x)p (x | θ )dθ 。
従って、我々は、後方からのサンプルを持っている場合、と言う、この量は、によって近似することができます。(θ1、。。。、θN)
1p (x)≈ 1N∑j = 1N1p (x | θj)。
この近似は、重要度サンプリングの概念に関連しています。
Nealのブログで説明されているように、多数の法則により、この推定量には一貫性があることがわかっています。問題は、適切な近似に必要なが膨大になる可能性があることです。参照してくださいニールさんのブログやロバートさんのブログ1、2、3、4いくつかの例について。N
代替案
を近似する多くの選択肢があります。ショパンとロバート(2008)は、いくつかの重要度サンプリングベースの方法を提示しています。p (x)
2. MCMCサンプラーを十分に長く実行しない(特にマルチモダリティが存在する場合)
メンドーサとグティエレス-ペーニャ(1999)は、推論前/後方参照を 2つの通常の手段の比率および実際のデータセットを使用して、このモデルを用いて得られた推論の例を提示します。MCMC法を使用して、平均φの比の後方のサイズのサンプルを取得します。2000年φ
φ (0.63 、5.29 )00
(0 、7.25 )
3.収束の評価、開始値の選択、チェーンの貧弱な振る舞いなどの他のいくつかの問題は、ゲルマン、カーリン、ニールによるこの議論で見つけることができます。
4.重要度サンプリング
g
私= ∫f(x )dx = ∫f(x )g(x )g(x )dx 。
g(x1、。。。、xN)私
私≈ 1N∑j = 1Nf(xj)g(xj)。
gfN
# Integrating a Student's t with 1 d.f. using a normal importance function
x1 = rnorm(10000000) # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))
# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))