私はハミルトニアンモンテカルロ(HMC)の内部の仕組みを理解しようとしていますが、決定論的な時間積分をメトロポリスヘイスティングの提案に置き換えると、その部分を完全に理解できません。私は、Michael Betancourtによる素晴らしい入門論文「A Conceptual Introduction to Hamiltonian Monte Carlo」を読んでいるので、そこで使用されているのと同じ表記に従います。
バックグラウンド
マルコフ連鎖モンテカルロ(MCMC)の一般的な目標は、ターゲット変数qの分布を近似することです。
HMCのアイデアは、「位置」としてモデル化された元の変数qとともに、補助的な「運動量」変数を導入することです。位置と運動量のペアは拡張位相空間を形成し、ハミルトニアンダイナミクスによって記述できます。結合分布π (q 、p )は、マイクロカノニカル分解に関して記述できます。
、
ここで、パラメータを表し(Q 、P )所定のエネルギー準位にEとしても知られている、典型的なセット。図については、図21および図22を参照してください。
元のHMC手順は、次の2つの交互のステップで構成されています。
エネルギーレベル間でランダムな遷移を実行する確率的ステップ、および
指定されたエネルギーレベルに沿って時間積分(通常は跳躍の数値積分によって実装されます)を実行する決定論的ステップ。
この論文では、リープフロッグ(またはシンプレクティック積分器)には小さな誤差があり、数値的な偏りが生じると主張されています。したがって、それを決定論的なステップとして扱うのではなく、これをMetropolis-Hasting(MH)の提案に変えてこのステップを確率論的にする必要があります。結果の手順では、分布から正確なサンプルが得られます。
ご質問
私の質問は:
1)決定論的な時間積分をMH提案に変換するこの変更は、生成されたサンプルがターゲット分布に正確に従うように数値バイアスをキャンセルするのはなぜですか?
2)物理学の観点から、エネルギーは与えられたエネルギーレベルで保存されます。これが、ハミルトンの方程式を使用できる理由です。