最大事後推定が利用可能な場合、MCMCベースの方法は適切ですか?


13

多くの実際のアプリケーションでは、事後分析が(たとえば、事前確率が共役であったため)MCMCベースの方法を使用してパラメーターを推定することに気づきました。私にとっては、MCMCベースの推定器よりもMAP推定器を使用する方が理にかなっています。MCMCが分析事後の存在下で依然として適切な方法である理由を誰かが指摘できますか?


2
実際にこの例を挙げていただけますか?共役および条件付き共役である事前分布とは異なることに注意してください。多くのギブスサンプリングアプリケーションでは、選択された事前分布は条件付き共役ですが、事前分布自体は共役ではありません。たとえば、潜在ディリクレ配分を検討します。

4
MAPがこれとどう関係するのかは不明です。ベイズ推定量は、事後モードではなく事後平均です。事前分布が共役ではない場合でも、MAP推定器を取得するための最適化を行うことができます。STANは、これを多少の事前分布に対して行います。MCMCを実行する目的は、事後分布を推定することです。これには、MAP推定器よりもはるかに多くの情報が含まれています。

回答:


11

この場合、MCMCを使用する必要はありません。マルコフ連鎖モンテカルロ(MCMC)は、分布から値を生成するために使用される方法です。目標分布に等しい定常分布を持つ自己相関値のマルコフ連鎖を生成します。この方法は、ターゲット分布に分析形式がある場合でも、必要なものを取得するために機能します。ただし、このようなケースで機能する、よりシンプルで計算量の少ない方法があります。この方法では、優れた分析形式を持つ事後を処理します。

事後分布に利用可能な分析形式がある場合、標準の計算手法を使用して、その分布から最適化することによりパラメーター推定値(MAPなど)を取得することができます。ターゲットの分布が十分に単純な場合、パラメーター推定器の閉形式の解を得るかもしれませんが、そうでない場合でも、通常、単純な反復手法(たとえば、ニュートンラプソン、勾配降下など)を使用して見つけることができます任意の入力データのパラメーター推定を最適化します。ターゲット分布の変位値関数の分析フォームがあり、分布から値を生成する必要がある場合、逆変換サンプリングを介してこれを行うことができます、MCMCより計算量が少なく、複雑な自己相関パターンを持つ値ではなくIID値を生成できます。

これを考慮して、ゼロからプログラミングする場合、ターゲット配布に利用可能な分析フォームがある場合にMCMCを使用する理由はないようです。これを行う唯一の理由は、MCMCの汎用アルゴリズムが既に作成されており、最小限の労力で実装でき、分析フォームを使用する効率よりも必要な計算を行う労力の方が大きいと判断した場合です。特定の実用的な状況では、MCMCアルゴリズムが既に設定されており、最小限の労力で実装できる一般的に難治性の問題に対処します(たとえば、RStan)。これらの場合、問題の分析ソリューションを導き出すのではなく、既存のMCMCメソッドを実行するのが最も簡単かもしれませんが、後者はもちろん作業のチェックとして使用できます。


10

πθ

δΘLθδπθfバツ|θdθ
ππ

正規化定数が利用できない場合、

πθdθ
事後平均または中央値、さらには[定数を知る必要のないモード]を見つけると、ほとんどの場合に進みますMCMCアルゴリズムを通じて。例えば、私がしていた場合に関節密度を与え、場合、 に触発アリ-ミハイル・ハクコピュラ)が適切に正規化(実際にあることができるが、:条件付期待値の与えられた、この密度、下バツy01

fθバツy=1+θ[1+バツ1+y3]+θ21バツ1y[1θ1バツ1y]3θ11
Φ1バツY=yΦは通常のcdfであり、閉じた形式では使用できません。しかしこれは第一の関心事です。

また、最大事後推定量は損失関数に対応せず、密度の閉形式表現は、定数であってもMAPを見つけられないため、ベイジアン設定では最も自然な推定量ではないことに注意してください。必ずしも簡単です。または関連するMAPを使用します。


2

私が読んだように、この質問は2つのやや直交する質問をしている。1つは、事後手段よりもMAP推定器を使用する必要があり、もう1つは、事後分析手段がある場合にMCMCを使用するかどうかです。

事後平均に対するMAP推定量に関しては、理論的には@Xianの回答で述べられているように、一般に事後平均が好まれます。MAP推定器の本当の利点は、特に後部が閉じた形ではないより一般的なケースでは、後部平均の推定よりもはるかに高速(数桁)に計算できることです。事後分布がほぼ対称である場合(サンプルサイズが大きい多くの問題でよくあるケースです)、MAP推定値は事後平均に非常に近いはずです。したがって、MAPの魅力は、実際には事後平均の非常に安価な近似値になり得ることです。

正規化定数を知っていても事後モードを見つけるのに役立たないので、事後の閉じた形の解を持っていることは、事後を特定の分布として認識する場合を除いて、技術的にMAP推定値を見つけるのに役立たないことに注意してください私たちはそれがモードであることを知っています。

2番目の質問に関しては、事後分布が閉じた形式である場合、一般的にMCMCアルゴリズムを使用する理由はありません。理論的には、事後分布の閉形式の解はあるが、何らかの関数の平均の閉形式がなく、この閉形式の分布から直接描画を取得できない場合 MCMCアルゴリズムを使用できます。しかし、私はこの状況のケースを知りません。


1

MCMCメソッドは、閉じた形式のソリューションが存在する場合でも、必ずしも不適切ではないと主張します。明らかに、分析ソリューションが存在する場合は便利です。通常は高速であり、収束などの懸念を回避できます。

一方、一貫性も重要です。テクニックからテクニックに切り替えると、プレゼンテーションが複雑になります。せいぜい、外部のディテールが、実質的な結果から視聴者を混乱させたり、そらしたりする可能性があり、最悪の場合、結果を偏らせる試みのように見えます。閉じた形式のソリューションを認めるモデルがいくつかある場合は、厳密に必要ではない場合でも、同じMCMCパイプラインを介してそれらをすべて実行することを強くお勧めします。

これに加えて、慣性(「機能するこのスクリプトがあります」)が、表示されている内容のほとんどを占めていると思われます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.