MCMCの実用的な例


14

MCMCに関連するいくつかの講義を受けていました。ただし、使用方法の良い例は見つかりません。誰でも私に具体的な例を与えることができます。私が見ることができるのは、それらがマルコフ連鎖を実行し、その定常分布が望ましい分布であると言うことです。

希望する分布をサンプリングするのが難しい良い例が欲しいです。そこで、マルコフ連鎖を作成します。マルコフ連鎖の定常分布がターゲット分布になるように遷移行列を選択する方法を知りたい


基本的なマルコフ連鎖理論を使用して、特定のサンプリングスキームが目的の結合分布である定常分布を持つことを示します。最も単純な例では、バニラギブスサンプラーは完全な条件付き分布からシミュレートします。対応する遷移カーネルは、それらが収束の条件を満たしている場合(多くの場合、簡単に表示できます)、ジョイント分布が定常分布としてあることを簡単に示すことができます。同様に、Metropolis Hastingsなども同様です。これは、MCMCは、マルコフ連鎖でどのように説明していない、あなたが見ている講義のように聞こえる
Glen_b -Reinstateモニカ

回答:


3

サンプリングが困難な分布の良い例は、ハードコアモデルです。概要については、このページを参照してください。

http://www.mathematik.uni-ulm.de/stochastik/lehre/ss06/markov/skript_engl/node34.html

このモデルは、いくつかの固定nについてグリッドにわたる分布を定義します。グリッドの各ポイントでは、1または0の値を使用できます。グリッドをハードコアモデルの下で許容できるようにするために、グリッド上の2つの隣接するポイントの両方が1の値を持つことはできません。n×nn

以下の画像は、ハードコアモデルでのグリッドの許容可能な構成例を示しています。この画像では、黒のドットとして表示され、白のゼロとして表示されます。2つの黒い点が隣接していないことに注意してください。8×8

ハードコアモデルでの$ 8 \ times 8 $グリッドの許容される構成の例

このモデルのインスピレーションは物理学に由来すると思います。グリッド内の各位置は粒子であり、その位置の値は電荷またはスピンを表すと考えることができます。

あれば私たちは、ある許容グリッドの母集団から、一様にサンプリングしたい許容グリッドのセットがあり、我々は、サンプリングしたいE EとなるようにEeE

p(e)=1|E|

どこ許容されるすべての構成の数です。|E|

グリッドを検討していることを考えると、これはすでに課題ですE | 許容グリッドの数は? n×n|E|

MCMCの優れた点の1つは、正規化定数の評価が困難または不可能な分布からサンプリングできることです。

この問題に対してMCMCを実装する方法の詳細に関するペーパーを読むことができますが、比較的簡単です。



2

統計上のもう一つの困難な問題。質問は古いですが、オンラインの入門的な例は手に入れるのが難しいです。したがって、PageRankのマルコフランダムウォークの後に誰かがMCMCによって混乱させられ、簡単に回答を得ることができるという期待に満ちている場合に備えて、2つの優れた例を単純化します。どのくらいですか?それはフォローアップの質問かもしれません。

FIRST EXAMPLE:

N01

困難なのは、すべての機械的なステップを経た後、魔法のトリックが1つしかないということです提案された値受け入れる拒否するかの2項決定です

xmean0sd 1rnorm(10000)

epsϵxixi+1runif(1, - eps, eps)xi

したがって、提案されたすべての値は、ランダムに、およびの境界内で以前の値とは異なります[- eps,+ eps]

ii+1

N(0,1)xi+1xi

min(1, dnorm(candidate_value)/dnorm(x))1N(0,1) pdfxi+1ximin(1, ...)dnorm

min(1, dnorm(candidate_value)/dnorm(x))runif(1)01x[i+1]x[i]

sd10

0x = 0; vec[1] = x

SECOND EXAMPLE:

これはより刺激的で、データセットが与えられたランダムパラメーターの対数尤度を計算することにより、線形回帰曲線のパラメーター推定することを参照します。ただし、コード行の解釈は、最初の例と非常によく似た手順に従って、ここ保存された圧縮シミュレーションに組み込まれています。


いくつかのマイナーな修正が必要です:「CMCMに惑わされた土地」...反転する必要があります。" Rosenbluth-Hatings " ....おそらくそこに余分な "s"が必要です。最初の例は、正確に「サンプリングするのが難しい」わけではありません(質問が尋ねているように)。どちらの例もメトロポリス・ヘイスティングス(確かに重要)に見えますが、MCMCはそれ以上のものです。ほんの一例として、多くの人がギブスのサンプリングを使用しており、多くの場合JAGS / BUGS / etcを介しています。そこで提案されたステップの受け入れに関する決定はありません-あなたは常に動きます。
Glen_b-モニカの復活

欠落している「s」、CMCM異性体のスペルを修正しました。名前の問題に対処するYouTubeへの不当なハイパーリンクを取り除きました。(古い)質問の特定の要求にもかかわらず、詳細に説明するために最初の例を選んだ理由を説明しました。これらすべての問題を指摘していただきありがとうございます。あなたの最後の行の意味については確信がありません。
アントニ・パレラダ

これは単に「魔法のトリックは1つだけです。提案された値を受け入れるか拒否するかのバイナリ決定」という行への参照です。すべてのMCMCアルゴリズムのプロパティではないことを指摘します。それ自体は、あなたの答えに問題があるという意味ではありません。必要に応じて、明確化と見なすことができます。異性体のビットは良かった。
Glen_b -Reinstate Monica

1

このYoutubeビデオは、MCMCを使用して解決された単純な問題の非常に素晴らしい視覚化です。

関心のある分布は、線形回帰の可能な勾配と切片にわたる事後分布です(右上のパネル)。勾配と切片のいくつかの組み合わせは非常に可能性が高い(つまり、観測されたデータポイントを生成する可能性が高く、アプリオリの予想と一致する)ため、頻繁にサンプリングする必要があります。他の組み合わせはあり得ない(たとえば、データポイントのクラウドを通過しない青い線に対応する場合)、より少ない頻度でサンプリングする必要があります。

左下の大きなパネルは、スロープとインターセプトの2次元空間を通るマルコフ連鎖の経路を示しています。ヒストグラムは、これまでのチェーンの進行状況の1次元の要約を示しています。チェーンが十分に長く実行されると、可能性のある勾配と切片の値の分布の非常に良い推定値が得られます。

この場合、MCMCはやり過ぎですが、ソリューションを書き留めるのが難しく、マルコフチェーンで直接解決しようとするよりも可能性を探る方が理にかなっている問題がいくつかあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.