MCMC; 後部から「純粋」で「十分に大きい」サンプルがあることを確認できますか?そうでない場合、どのように機能しますか?


12

このスレッドを参照:マルコフ連鎖モンテカルロ法(MCMC)を素人にどのように説明しますか?

マルコフ連鎖とモンテカルロの組み合わせであることがわかります。マルコフ連鎖は、不変の制限分布として事後で作成され、その後、制限分布(=事後)からモンテカルロドロー(従属)が作成されます。

後ことをしましょうと言う(私はここに簡素化していますことを知っている)手順我々は極限分布ですΠ(*)。LΠ

確率変数の配列であるマルコフ連鎖は、私はシーケンスを取得Xは、iの確率変数であるとΠは ''制限確率変数であります''サンプリング元です。 X1,X2,,XL,Π,Π,Π,ΠXiΠ

MCMCは初期値から始まります。つまり、は、その1つの値x 1ですべての質量を持つランダム変数です。私は確率変数の実現のための確率変数と小文字のために大文字を使用する場合は、MCMCは私にシーケンス与え、X 1X 2X 3... のx Lπ 1π 2π 3π のn。したがって、MCMCチェーンの長さはL + nです。X1x1x1,x2,x3,xL,π1,π2,π3,....πn

[[*注:大文字はランダム変数(つまり、一連の結果)であり、小さなは結果、つまり1つの特定の値です。*]]x

もちろん、唯一の私の「」事後「」と後部を近似するための「」だけでなく「に属しているが」の値nが '十分な大きさ「」でなければなりません。πin

私はこれをまとめるならば、私はMCMCチェーン持ち長さN = L + N、のみπ 1π 2... π Nは私の後方近似に関連する、及びnは十分な大きさでなければなりません。x1,x2,x3,xL,π1,π2,π3,....πnN=L+nπ1,π2,,πnn

事後近似の計算に(つまり、不変分布に到達する前の実現)の一部を含めると、「ノイズ」になります。xi

私はMCMCチェーンの長さを知っていますが、Lの知識がなければ、つまり、限界分布からサンプリングするはずのステップで、ノイズを含まないこともできません。特に、限界分布からのサンプルのサイズであるn = N Lについて確認してください。特に、「十分に大きい」かどうかはわかりません。 N=L+nLn=NL

したがって、私が理解した限りでは、この値は、事後の近似の品質(ノイズとそこからの大きなサンプルの除外)にとって非常に重要ですL

MCMCを適用するときに合理的な推定値を見つける方法はありますか?L

(*)一般に、は初期値x 1に依存すると思います。Lx1

回答:


6

TL DR; あなたは見積もることができないので、L = 。したがって、単純化の仮定は決して真に不可能です。(MCMCの一般的な世界ではなく、そうなる場合もあります)。ただし、初期バイアスを小さくするNを決定できます。LL=N


基本的に、あなたの質問は「バーンイン時間をどのように見積もることができますか?」に要約されます。バーンインは、マルコフ連鎖が収束していないため、開始サンプルを捨てる行為です。「バーンイン」時間を見積もるのに役立つ多くのMCMC診断があります。それらのレビューはこちらで確認できます

焼き付きに関しては2つの流派があります。人気のあるものは、それらの診断の1つを使用してを決定し、Lサンプルを破棄します。2つ目のスクールでは、最初のLサンプルは重要ではないので、心配しないでください。チャーリー・ガイアーはこれについて暴言を持っていますが、それに同意します。LLL

次に、質問のより技術的な詳細に移ります。

質問で簡単に仮定することは、最終的に(ステップ後)、サンプラーが制限分布から描画を開始するということです。したがって、Lステップ後のサンプルは、相関はあるものの純粋な描画です。これは真実ではありません。厳密に言えば、Lです。マルコフ連鎖は、有限時間で制限分布に真に収束することはありません。したがって、Lの推定はほとんど無意味です。LLLL

この問題を提起する別の方法は次のとおりです。Lステップの後、マ​​ルコフ連鎖は制限分布に「十分に近い」というようなは何ですか。これは、ほとんどの診断が答えようとする質問です。上記の診断は一般に非常にリベラルであり、「収束」を診断する前に診断できることがますます同意されています。ここに、診断の弱点のいくつかを示す論文があります。LL

上記がユーザーに代わりに行うことを要求するのは、を心配しないで、Nを心配することです。一般的に、ユーザーは完全な事後分布に興味を持っているのではなく、特定の量に興味を持っています。多くの場合、この量は事後の平均、または予想として書き留めることができるその他の関数です。これは、MCMCの「モンテカルロ」部分の出番です。なぜなら、モンテカルロは、積分による積分の推定を示しているからです。その場合、X 1X 2X 3... X Nは、あなたのマルコフ連鎖(私は無視していますどのように予告でLは以来、LはあるLNX1,X2,X3,,XNLL)、そして我々は事後平均(推定したい)、そして ˉ θ N = 1をθ

θ¯N=1Ni=1NXi.

が十分に大きい場合、サンプルの初期バイアスは重要ではないという考え方です。もちろん、開始値が極限分布の高確率空間から病的に遠く離れている場合、ユーザーは最初の数サンプルを目で見て捨てることができます。Lの推定とは異なります。これは推定ではなく、明らかに破損したサンプルに対する教育的な無視であるためです。NL

さて、当然の問題は、大きさはどれくらいかということです。答えは、θをどれだけうまく推定したいかによって異なります。優れた推定値が必要な場合は、より多くのサンプルが必要です。適切な推定値で十分な場合は、より小さなサンプルで問題ありません。これは、標準の統計問題でまさに起こることでもあります。Nθ

私たちは見積もりの「良さ」を定量化する方法は、我々が言うことができるものを」、考えることです?、モンテカルロ・エラーは、合理的な条件の下では、と言うマルコフ連鎖CLT実際にそこにある Nは、任意の初期分布のための(θ¯Nθ)N

N(θ¯Nθ)dNp(0,Σ),

ここで、及びΣは漸近共分散行列です。ここで重要なのは、初期分布の結果が正しいことです。θRpΣ

が小さい場合、推定器が良いことがわかります。このホワイトペーパーでは、この停止のアイデアを示し、ここでの私の答えはその方法をまとめたものです。論文の結果も、プロセスの初期分布に関係ありません。Σ/N


回答のThx(+1)であることはわかっていますが、単純化すると明示的に述べました。CLTに関しては、分布の収束のためにΣ / nであるべきではありませんか?そして、のためにθ Nは、それは、問題の遺骨を、それらを落とした後であればあるため、ということは、バーンイン値を落とした後に計算されましたか?(TL DRの意味をお聞きしてもよろしいですか?)論文をありがとう、詳細に読むLΣ/nθ^N

タイプミスを修正、それがされている必要がありますˉ θ Nは、すべてのサンプルから計算され、何がドロップされていません。TL DRは、「長すぎて読まなかった」という意味です。CLTが初期配布に対して保持することを追加するのを忘れました。それを追加します。Σ/Nθ¯N
グリーンパーカー

X1πg¯n

X1ππ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.