Gibbs Samplingアルゴリズムは詳細なバランスを保証しますか?


17

ギブスサンプリングがマルコフ連鎖モンテカルロサンプリング用のメトロポリスヘイスティングスアルゴリズムの特殊なケースであることは、最高の権限1に基づいています。MHアルゴリズムは、常に詳細なバランスプロパティを持つ遷移確率を提供します。ギブズもそうすべきだと思う。では、次の単純なケースでどこがおかしいのでしょうか?

2つの離散(簡単にするため)変数のターゲット分布場合、完全な条件付き分布は次のとおりです。 π(x,y)

q1(x;y)=π(x,y)zπ(z,y)q2(y;x)=π(x,y)zπ(x,z)

ギブスサンプリングを理解すると、遷移確率は次のように記述できます

Prob{(y1,y2)(x1,x2)}=q1(x1;y2)q2(x2;x1)

問題は、 しかし私が得ることができる最も近いものは これは微妙に異なり、詳細なバランスを意味するものではありません。ご意見ありがとうございます!

π(y1,y2)Prob{(y1,y2)(x1,x2)}=?π(x1,x2)Prob{(x1,x2)(y1,y2)},
π(y1,y2)Prob{(y1,y2)(x1,x2)}=π(y1,y2)q2(x2;x1)q1(x1;y2)=π(x1,x2)zπ(x1,z)π(x1,y2)zπ(z,y2)π(y1,y2)=π(x1,x2)q2(y2;x1)q1(y1;y2)

回答:


15

マルコフ連鎖の1つの遷移を条件付き分布から順番にサンプリングする「ギブス掃引」と見なすことによって得られるマルコフ連鎖の詳細なバランスを表示しようとしました。このチェーンでは、詳細なバランスが満たされていません。ポイントは、条件付き分布からの特定のコンポーネントの各サンプリングが、詳細なバランスを満たす遷移であるということです。Gibbsサンプリングは、わずかに一般化されたMetropolis-Hastingsの特殊なケースであり、複数の異なる提案を交互に繰り返すと言う方が正確です。詳細は次のとおりです。

スイープは詳細なバランスを満たしていません

私は反例を構築します。次の表に示す確率を持つ2つのベルヌーイ変数()を考えます。 Gibbsスイープはがサンプリングされるように順序付けられていると仮定する最初。1回の移動で状態から状態に移動することは、から移動する必要があるため不可能です。ただし、からに移動すると、正の確率、つまりX1,X2

X2=0X2=1X1=01313X1=1013
X1(0,0)(1,1)(0,0)(1,0)(1,1)(0,0)14。したがって、詳細なバランスが満たされていないと結論付けます。

ただし、このチェーンにはまだ正しい分布があります。詳細なバランスは、ターゲット分布に収束するための十分な条件ですが、必須ではありません。

コンポーネントごとの動きは、詳細なバランスを満たします

条件付き分布から最初の変数をサンプリングする2変量状態を考えます。と間の移動は、場合、両方向でゼロの確率を持ち、これらの場合、詳細なバランスが明らかに成り立ちます。次に、検討し: (x1,x2)(y1,y2)x2y2x2=y2

π(x1,x2)Prob((x1,x2)(y1,x2))=π(x1,x2)p(y1X2=x2)=π(x1,x2)π(y1,x2)zπ(z,x2)=π(y1,x2)π(x1,x2)zπ(z,x2)=π(y1,x2)p(x1X2=x2)=π(y1,x2)Prob((y1,x2)(x1,x2)).

コンポーネントごとの動きは、メトロポリス・ヘイスティングスの動きですか?

最初のコンポーネントからサンプリングすると、提案分布は条件付き分布です。(他のすべてのコンポーネントについては、確率現在の値を提案します)。からへの移動を考慮すると、ターゲット確率の比率は しかし、提案確率の比率は 1(x1,x2)(y1,y2)

π(y1,x2)π(x1,x2).
Prob((y1,x2)(x1,x2))Prob((x1,x2)(y1,x2))=π(x1,x2)zπ(z,x2)π(y1,x2)zπ(z,x2)=π(x1,x2)π(y1,x2).
そのため、目標確率の比率と提案確率の比率は逆数であるため、受け入れ確率はます。この意味で、ギブスサンプラーの各動きは、メトロポリスヘイスティングスの動きの特殊なケースです。ただし、この観点から見た全体的なアルゴリズムは、通常提示されるメトロポリス・ヘイスティングスアルゴリズムのわずかな一般化であり、異なる提案分布(ターゲット変数の各コンポーネントに1つ)を交互に使用します。1

素晴らしい回答、ありがとうございます(3番目のセクションのマイナー編集:y_2-> x_2)。ギブススイープを1ステップ呼び出すとき、定常分布の存在は(既約性と再発とともに)初期状態から定常分布に収束するのに十分な条件ですか?
イアン14年

3
ギブスサンプラーは、許容確率1のメトロポリスヘイスティングスの動きのコンポジションです。各ムーブは可逆ですが、ステップの順序がランダムでない限り、コンポジションはそうではありません。
西安14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.