MCMCに関連するいくつかの講義を受けていました。ただし、使用方法の良い例は見つかりません。誰でも私に具体的な例を与えることができます。私が見ることができるのは、それらがマルコフ連鎖を実行し、その定常分布が望ましい分布であると言うことです。
希望する分布をサンプリングするのが難しい良い例が欲しいです。そこで、マルコフ連鎖を作成します。マルコフ連鎖の定常分布がターゲット分布になるように遷移行列を選択する方法を知りたい
MCMCに関連するいくつかの講義を受けていました。ただし、使用方法の良い例は見つかりません。誰でも私に具体的な例を与えることができます。私が見ることができるのは、それらがマルコフ連鎖を実行し、その定常分布が望ましい分布であると言うことです。
希望する分布をサンプリングするのが難しい良い例が欲しいです。そこで、マルコフ連鎖を作成します。マルコフ連鎖の定常分布がターゲット分布になるように遷移行列を選択する方法を知りたい
回答:
サンプリングが困難な分布の良い例は、ハードコアモデルです。概要については、このページを参照してください。
http://www.mathematik.uni-ulm.de/stochastik/lehre/ss06/markov/skript_engl/node34.html
このモデルは、いくつかの固定nについてグリッドにわたる分布を定義します。グリッドの各ポイントでは、1または0の値を使用できます。グリッドをハードコアモデルの下で許容できるようにするために、グリッド上の2つの隣接するポイントの両方が1の値を持つことはできません。
以下の画像は、ハードコアモデルでのグリッドの許容可能な構成例を示しています。この画像では、黒のドットとして表示され、白のゼロとして表示されます。2つの黒い点が隣接していないことに注意してください。
このモデルのインスピレーションは物理学に由来すると思います。グリッド内の各位置は粒子であり、その位置の値は電荷またはスピンを表すと考えることができます。
あれば私たちは、ある許容グリッドの母集団から、一様にサンプリングしたい許容グリッドのセットがあり、我々は、サンプリングしたいE ∈ Eとなるように
どこ許容されるすべての構成の数です。
グリッドを検討していることを考えると、これはすでに課題です。E | 許容グリッドの数は?
MCMCの優れた点の1つは、正規化定数の評価が困難または不可能な分布からサンプリングできることです。
この問題に対してMCMCを実装する方法の詳細に関するペーパーを読むことができますが、比較的簡単です。
私があなたに与えることができる最良の例はこれだと思う:
Rのいくつかの便利なコードが含まれています。
ここで記事を再現できると思いますが、意味がありません。
統計上のもう一つの困難な問題。質問は古いですが、オンラインの入門的な例は手に入れるのが難しいです。したがって、PageRankのマルコフランダムウォークの後に誰かがMCMCによって混乱させられ、簡単に回答を得ることができるという期待に満ちている場合に備えて、2つの優れた例を単純化します。どのくらいですか?それはフォローアップの質問かもしれません。
FIRST EXAMPLE:
困難なのは、すべての機械的なステップを経た後、魔法のトリックが1つしかないということです。提案された値を受け入れるか拒否するかの2項決定です。
mean
sd
rnorm(10000)
eps
runif(1, - eps, eps)
したがって、提案されたすべての値は、ランダムに、およびの境界内で以前の値とは異なります[- eps,+ eps]
。
min(1, dnorm(candidate_value)/dnorm(x))
min(1, ...)
dnorm
min(1, dnorm(candidate_value)/dnorm(x))
runif(1)
x[i+1]
x[i]
sd
x = 0; vec[1] = x
SECOND EXAMPLE:
これはより刺激的で、データセットが与えられたランダムパラメーターの対数尤度を計算することにより、線形回帰曲線のパラメーターを推定することを参照します。ただし、コード行の解釈は、最初の例と非常によく似た手順に従って、ここに保存された圧縮シミュレーションに組み込まれています。
このYoutubeビデオは、MCMCを使用して解決された単純な問題の非常に素晴らしい視覚化です。
関心のある分布は、線形回帰の可能な勾配と切片にわたる事後分布です(右上のパネル)。勾配と切片のいくつかの組み合わせは非常に可能性が高い(つまり、観測されたデータポイントを生成する可能性が高く、アプリオリの予想と一致する)ため、頻繁にサンプリングする必要があります。他の組み合わせはあり得ない(たとえば、データポイントのクラウドを通過しない青い線に対応する場合)、より少ない頻度でサンプリングする必要があります。
左下の大きなパネルは、スロープとインターセプトの2次元空間を通るマルコフ連鎖の経路を示しています。ヒストグラムは、これまでのチェーンの進行状況の1次元の要約を示しています。チェーンが十分に長く実行されると、可能性のある勾配と切片の値の分布の非常に良い推定値が得られます。
この場合、MCMCはやり過ぎですが、ソリューションを書き留めるのが難しく、マルコフチェーンで直接解決しようとするよりも可能性を探る方が理にかなっている問題がいくつかあります。