MCMC結果のトレースプロットが必要な理由


12

私はMCMCメソッドを使用して研究論文を読んでおり、それらのほとんどがトレースプロットを提供しているのがわかります。なぜモンテカルロマルコフチェーンでトレースプロットが必要なのですか?パラメータのトレースプロットは何を示していますか?

回答:


17

パラメータトレースプロットを作成して、アプリオリ分布が適切に調整されていることを確認します。これは、MCMCアルゴリズムの実行中に十分な状態変化があるパラメータによって示されます。

極端な例は、アプリオリ分布の分散を0に設定することです。その後、事後パラメーター推定値は決して変更されません。あなたのアルゴリズムはあなたが最良のパラメーター推定値を持っていると言いますが、これが本当に最適であるかどうかを決定するのに十分な数のパラメーターをチェックしませんでした。事前分布の分散を高く設定しすぎると、同様の問題が発生します。これは、新しいパラメーターがデータに関連する可能性が低いためです。そのため、新しいパラメーターで計算された対数尤度は、古いパラメーターを使用した対数尤度よりも優れているとは限りません。(たとえば、「真の」パラメーターが0.5で初期推定が2であるが、平均が2で分散が10,000の正規分布から選択する場合、1に近いパラメーターを取得することはほとんどありません。 。

対数尤度分布の局所的な最小値と最大値にとらわれないようにパラメーターの状態を十分に変更できるが、妥当なパラメーター推定値を得るには十分に細かいアプリオリ分散を選択する必要があります。ほとんどの文献では、40〜60%の時間で状態を変更するためのパラメーターを取得することを推奨しています。

トレースプロットのもう1つの理由はバーンインです。通常、バーンイン期間はプロットで明白です(たとえば、真のパラメーターが1.5で、初期推定値が4の場合、パラメーター推定値が4から1.5に急速に移動するのがわかります。 1.5前後で「バウンス」します)。通常、最初のn回の反復を除外します。ここで、nはバーンインを削除したことが確実な大きさ(たとえば1000)ですが、計算に時間がかかる場合、またはパラメーター推定がnよりも収束に時間がかかる場合次に、バーンインを説明するために多少の観察を省略したい場合があります。バーンイン期間が終了する場所をプロットで確認して、バーンインが結果に影響していないことを確認できます。

パラメータポイントの推定に関連して話をしていることに注意してください。パラメータの分散を推定する場合は、適切な状態変化があることを確認することがさらに重要です。


5
+1しかし、もう1つの側面は、正式な収束診断を完全に信頼しておらず、収束したと主張する前に何かを目で確認したいということです。これは完全に合理的であるかどうかは別の問題です...
conjugateprior

1
この古い投稿を掘り下げてすみません。しかし、十分な数の反復がある限り、(以前の分布から生成された)以前の値は無関係であると想定されていませんか?
mscnvrsy 2016

@mscnvrsy:情報量を少なくしたい場合は、Jeffryの事前または均一の事前のように情報のない事前に配置できます。
ベンザミン

3
MCMCトレースプロットは、以前の分布のキャリブレーションに何らかの形で関係しているという考えには完全に同意しません。MCMCアルゴリズムは、事前分布の選択に関係なく、特定の事後分布を目的とし、適切な条件下で、この定常分布に収束するマルコフ連鎖を作成します。トレースプロットを見ることは、マルコフ連鎖の収束またはその欠如を評価する場合にのみ役立ちます。
西安
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.