MCMCアルゴリズムのエラーの例


28

マルコフ連鎖モンテカルロ法の自動チェックの方法を調査していますが、このようなアルゴリズムを構築または実装するときに発生する可能性のあるミスの例をいくつか紹介します。発行された論文で誤った方法が使用された場合のボーナスポイント。

他のタイプのエラー(たとえば、エルゴディックではないチェーン)にも関心があるのに、エラーがチェーンの不変分布が正しくないことを意味する場合に特に興味があります。

このようなエラーの例は、Metropolis-Hastingsが提案された移動を拒否したときに値を出力できないことです。


7
私のお気に入りの例の1つは、優れた漸近特性を持っているが実際には機能しないため、調和平均推定量です。Radford Nealは彼のブログでこれについて議論しています。「悪いニュースは、この推定量が正しい答えに近づくために必要なポイントの数が、観測可能な宇宙の原子の数よりも多いことが多いことです」。このメソッドは、アプリケーションで広く実装されています。

3
もう1つはニール教授のご厚意によるものです。
シアン

5
@Cyan Nealを真剣に受けとめるためには、インターネット上で投稿するだけでなく、彼の記事を受け入れるジャーナルを見つけたはずだと思います。私は彼が正しいと信じており、審判と著者は間違っています。発表された結果と矛盾する論文を発表することは困難であり、JASAの拒否は落胆させるものですが、成功するまでは他のいくつかのジャーナルを試してみるべきだったと思います。調査結果に信頼性を追加するには、部分的で独立した審判が必要です。
マイケルR.チャーニック

4
ニール教授を常に真剣に受け止めるべきです!; o)深刻なことに、このような結果を公開するのは困難であり、残念ながら現代の学術文化はそのようなことを重視していないようです。したがって、彼にとって優先度の高い活動でなければ理解できます。興味深い質問、私は答えに非常に興味があります。
ディクランマースピアル

6
@マイケル:おそらく。多くの場合、ニール教授の立場を含め、同様の状況のすべての側面にいたことから、私の事例観察では、紙の拒絶は多くの場合受け入れられるように、ほとんどの場合非常にわずかな情報内容しか持ちません。ピアレビューは、人々が認めようとするよりもはるかに騒々しいものであり、多くの場合、ここでのケースのように、部分的関心のある(つまり、独立していない)当事者や関心があります。とは言うものの、私は、元のコメントが、これまでのトピックから遠ざかっているとは考えていませんでした。問題についてのあなたの考えを共有してくれてありがとう。
枢機

回答:


11

1.限界尤度および調和平均推定量

周辺尤度は、事後分布の正規化定数として定義されています

pバツ=Θpバツ|θpθdθ

この量の重要性は、ベイズ因子を介したモデル比較で果たす役割に由来します。

この量を概算するためのいくつかの方法が提案されています。Raftery et al。(2007)Harmonic mean estimatorを提案してください。アイデアは、関係を使用して構成されています

1pバツ=Θpθ|バツpバツ|θdθ

従って、我々は、後方からのサンプルを持っている場合、と言う、この量は、によって近似することができます。θ1θN

1pバツ1Nj=1N1pバツ|θj

この近似は、重要度サンプリングの概念に関連しています。

Nealのブログで説明されているように、多数の法則により、この推定量には一貫性があることがわかってます。問題は、適切な近似に必要なが膨大になる可能性があることです。参照してくださいニールさんのブログやロバートさんのブログ1234いくつかの例について。N

代替案

を近似する多くの選択肢があります。ショパンとロバート(2008)は、いくつかの重要度サンプリングベースの方法を提示しています。pバツ

2. MCMCサンプラーを十分に長く実行しない(特にマルチモダリティが存在する場合)

メンドーサとグティエレス-ペーニャ(1999)は、推論前/後方参照を 2つの通常の手段の比率および実際のデータセットを使用して、このモデルを用いて得られた推論の例を提示します。MCMC法を使用して、平均φの比の後方のサイズのサンプルを取得します。2000年φ

ここに画像の説明を入力してください

φ 0.635.2900

ここに画像の説明を入力してください

07.25

3.収束の評価、開始値の選択、チェーンの貧弱な振る舞いなどの他のいくつかの問題は、ゲルマン、カーリン、ニールによるこの議論で見つけることができます。

4.重要度サンプリング

g

=fバツdバツ=fバツgバツgバツdバツ

gバツ1バツN

1Nj=1Nfバツjgバツj

gfN

# Integrating a Student's t with 1 d.f. using a normal importance function   
x1 = rnorm(10000000)   # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))

# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))

2
彼らはいくつかの素晴らしい例です。興味がある人のために、図でエディタへの手紙はここにある:onlinelibrary.wiley.com/doi/10.1002/bimj.200800256/abstract
サイモン・バーンズ

2
非常に素晴らしく明確な要約!! (+1)
gui11aume

12

Darren Wilkinsonのブログでは、ランダムウォークメトロポリスヘイスティングスの一般的な間違いの詳細な例を示しています。全文を読むことをお勧めしますが、これはtl; drバージョンです。

1つの次元でターゲット分布が正の場合(ガンマ分布など)、その次元で負の値を持つプロポーザルはすぐに拒否しようとします。間違いは、提案が発生したことがないように破棄し、他の提案のみのメトロポリス・ヘイスティングス(MH)受け入れ率を評価することです。これは、非対称の提案密度を使用することになるため、間違いです。

著者は、2つの修正のうちの1つを適用することを提案しています。

  1. 「ネガ」を受け​​入れの失敗として数えます(そして、少し効率を失います)。

  2. その場合、正しいMH比を使用します。

πバツπバツΦバツΦバツ

ここで、はターゲット密度、Φは切り捨てられたランダムウォークの提案normalの正規化定数です。πΦϕ Φバツ=0ϕyバツdy


1
+1興味深い例。また、受入率に関連するMHの他の問題についても考えていました。0.234の最適なレートは使いすぎだと思います。

@ProcrastinatorあなたはMCMCの文献をよく知っています。これはあなたの専門分野ですか?
gui11aume

コメントありがとうございます。ベイジアン統計が好きなので、MCMCクロスを実行する必要があります;)。

1

真の収束が混合モデルでのラベルスイッチングの問題の例であり、Chib's(1995)estimatorの使用と結びついている非常に明確なケース(最初の回答で述べた限界尤度近似に関連Radford Neal(1999)が指摘したように、MCMCチェーンがターゲット分布のモードの一部を探索するという意味で正しく収束しない場合、Chibのモンテカルロ近似は正しい数値に到達できません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.