MCMCサンプラーで自己相関を引き起こしているものは何ですか?


7

ベイジアン分析を実行するときに確認する必要があるのは、MCMCサンプルの自己相関です。しかし、この自己相関を引き起こしている原因がわかりません。

ここでは、彼らはそれを言っています

[MCMCからの]高い自己相関サンプルは、変数間の強い相関によって引き起こされることがよくあります。

  1. MCMCの高い自己相関サンプルの他の原因は何でしょうか。

  2. JAGS出力で自己相関が観察されたときに確認するもののリストはありますか?

  3. ベイジアン分析で自己相関をどのように管理できますか?一部の人が痩せると言っいるのを知っていますが、他の人はそれが悪いと言っています。より長い期間モデルを実行することは別の解決策であり、残念ながら時間がかかり、MCMC内のサンプルのトレースにも影響を与える場合があります。なぜ一部のアルゴリズムは、探索して無相関にするのにはるかに効果的ですか?最初にチェーンの初期値を変更する必要がありますか?

回答:


6

ベイズ分析でマルコフ連鎖モンテカルロ(MCMC)アルゴリズムを使用する場合、多くの場合、目的は事後分布からサンプリングすることです。他の独立したサンプリング手法(拒否サンプリングなど)が不可能な場合は、MCMCを使用します。ただし、MCMCの問題は、結果のサンプルが相関していることです。これは、後続の各サンプルが現在のサンプルを使用して描画されるためです。

2つの主要なMCMCサンプリング方法があります。ギブスサンプリングとMetropolis-Hastings(MH)アルゴリズムです。

  1. サンプルの自己相関は多くの影響を受けます。たとえば、MHアルゴリズムを使用する場合、プロポーザル分布のステップサイズを調整することで、自己相関をある程度増減できます。ただし、ギブスサンプリングでは、このような調整はできません。自己相関は、マルコフ連鎖の開始値によっても影響を受けます。一般に、(未知の)最適な開始値があり、自己相関が比較的低くなります。ターゲット分布のマルチモダリティも、サンプルの自己相関に大きな影響を与える可能性があります。したがって、自己相関を明確に指示できるターゲット分布の属性があります。しかし、ほとんどの場合、自己相関は使用するサンプラーによって決定されます。大まかに言えば、MCMCサンプラーが状態空間の周りをより多くジャンプする場合、おそらく自己相関が小さくなります。
  2. 私はJAGSに慣れていません。
  3. サンプラーを既に決定していて、他のサンプラーをいじるオプションがない場合は、適切な開始値とステップサイズを見つけるために予備分析を行うことをお勧めします。サンプルを破棄することは、相関するサンプルを使用するよりも効率が悪いと主張されているため、一般に間引きは提案されていません。一般的な解決策は、サンプラーを長時間実行することです。これにより、実効サンプルサイズ(ESS)が大きくなります。こちらRパッケージをmcmcse ご覧ください。8ページのビネットを見ると、著者は推定プロセスに必要な最小有効サンプルの計算を提案しています。あなたはあなたの問題についてその数を見つけ、その多くの効果的なサンプルが得られるまでマルコフ連鎖を実行させます。

3
間引きに関しては、実用的な考慮事項の1つは、操作しやすいサンプル数です。たとえば、1億個のサンプルを取得する必要がある場合、1億個のサンプルを処理する代わりに、たとえば10,000個のかなり相関のないサンプルを保持するために、(メモリなどの観点から)シンすることがしばしば便利です。間引きによって少し非効率になることは(実際に少し便利になるかもしれませんが)、人々が行う本当に悪い統計的なことすべてと比較すると、常に私にとって比較的マイナーなポイントのように思えました。
ビョルン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.