非対角質量行列を使用してHMCを実装しようとしていますが、いくつかの用語につまずかれています。
BDA3とNealのレビューによると、運動エネルギーの項(便宜上、常に使用されていると思います)は
これは、ゼロ平均と共分散行列をもつ多変量正規と呼ばれることでも認識できます。BDA3(pg 301)は言う
単純にするために、通常、対角質量行列Mを使用します。その場合、φの成分は独立しており、各次元j = 1、。についてφj〜N(0、Mjj)です。。。、d。Mは、事後分布の逆共分散行列(var(θ| y))^-1で大まかにスケーリングすると便利です。
(私はN(0、M))を平均ゼロと共分散Mの多変量正規として読み取っています。)
私をつまずかせる部分は、「が事後分布の逆共分散行列で大まかにスケーリングすることは有用であるかもしれない...」と言っているところです。
そして、その直前にも、跳躍ステップ()を開始する運動量サンプルが、共分散行列をもつ多変量標準から抽出されます。 M
どっち?HMCに適したMを構築するには、事後の共分散または精度行列を推定しますか?にもかかわらず、である共分散行列の運動エネルギーを用いて、の推定値である精度マトリックスより効率的なアルゴリズムをもたらす後方のか?M
第二の質問:ここで私を導くことができる直感は何ですか?
運動量がポテンシャル/事後に対して直角に押し出されて混合を改善するように、精度行列を使用しますか?
または、勢いが後部の高確率の質量部分に向かってプッシュするようにしますか(そのため、そこからほとんどのサンプルを引き出します)。
psの単位行列を使用していない理由は、私の問題で、かなり高い次元(約1000)の事後の共分散行列の適切な推定値を事前に取得できるためです。