不適切な分布からのサンプリング(MCMCなどを使用)


15

私の基本的な質問は、不適切な分布からどのようにサンプリングするのですか?不適切な分布からサンプリングすることも理にかなっていますか?

ここでの西安のコメントは、この種の問題に対処するものですが、これについての詳細を探していました。

MCMCに固有:

MCMCについて話し、論文を読む際に、著者は適切な事後分布を取得したことを強調します。著者が後部が適切かどうかを確認するのを忘れた有名なGeyer(1992)の論文があります(そうでない場合は優れた論文)。

しかし、尤度と事前分布が不適切であり、結果の事後分布も不適切であり、MCMCを使用して分布からサンプリングするとします。この場合、サンプルは何を示していますか?このサンプルに役立つ情報はありますか?ここで、マルコフ連鎖は一時的またはヌル再帰的であることを認識しています。null再発の場合、肯定的なテイクアウェイはありますか?f(x|θ)θ

最後に、ここでのニールGの回答では、彼は

通常、MCMCを使用して、たとえ不適切であったとしても、後方からサンプリングできます。

彼は、このようなサンプリングはディープラーニングでは一般的だと述べています。これが正しい場合、これはどのように意味がありますか?


1
このjstor.org/stable/pdf/2246228.pdf?_=1462943547901は興味深いかもしれません
-peuhp

@peuhp間違いなく役に立ちます。私がこの論文から理解しているのは、サンプルから評価されるべき機能が積分可能である場合、不適切な事後からのサンプリングが理にかなっているということです。私の解釈は正しいですか?
グリーンパーカー

3
はい。不正脂肪尾に起因する不適切な後方、およびゼロの外部に等しい関数の自明な場合考えると上積分性のためのすべての素敵な性質を有する[ 0 1 ]。後部が不適切であるという事実は問題が終わっ一部であることを後方の一部のみとして無関係である[ 0 1 ][0,1][0,1][0,1]
jbowman

回答:


10

不適切な事後(密度)からのサンプリングは、確率的/理論的な観点からは意味がありません。これは、関数fがパラメーター空間で有限積分を持たないため、(有限測定)確率モデルΩ σ P(空間、シグマ代数、確率測定にリンクできないためです。 )。ff(Ω,σ,P)

不適切な事後をもたらす不適切な事前のモデルがある場合、多くの場合、MCMCを使用して、たとえばMetropolis-Hastingsなどのサンプルからサンプリングでき、「事後のサンプル」は妥当に見えるかもしれません。これは一見魅力的で逆説的に見えます。ただし、この理由は、MCMCメソッドが実際のコンピューターの数値制限に制限されているため、コンピューターのすべてのサポートが制限されている(そして離散的!)ためです。次に、これらの制限(有界性と離散性)の下では、ほとんどの場合、事後は実際に適切です。

後部のギブスサンプラーを構築できる例(わずかに異なる性質の)を示すHobertとCasellaの素晴らしいリファレンスがあり、後部のサンプルは完全に合理的に見えますが、後部は不適切です!

http://www.jstor.org/stable/2291572

同様の例が最近ここに登場しました。実際、HobertとCasellaは、MCMCメソッドを使用して事後の不正を検出することはできず、MCMCメソッドを実装する前に個別にチェックする必要があることを読者に警告します。要約すれば:

  1. Metropolis-Hastingsなどの一部のMCMCサンプラーは、コンピューターがパラメーター空間を制限し、2重化するため、不適切な後方からのサンプリングに使用できます(ただし、使用しないでください)。巨大なサンプルがある場合にのみ、いくつかの奇妙なことを観察できる可能性あります。これらの問題をどの程度検出できるかは、サンプラーで採用されている「楽器」の分布にも依存します。後者の点については、より詳細な議論が必要なので、ここに残すことを好みます。
  2. (ホーバートとカセラ)。不適切な事前分布を持つモデルのギブスサンプラー(条件付きモデル)を構築できるという事実は、事後(結合モデル)が適切であることを意味しません。
  3. 後部サンプルの正式な確率的解釈には、後部の妥当性が必要です。収束結果と証明は、適切な確率分布/測度に対してのみ確立されます。

PS(頬に少し舌):機械学習で人々がすることを常に信じてはいけません。ブライアンリプリー教授が述べたように、「機械学習は統計からモデルと仮定のチェックを差し引いたものです」。


(+1)すばらしい答えであり、私が考えていたもののほとんどに同意します。Hobert + Casellaのリファレンスを読みます。マルコフ連鎖がヌル回帰である場合、もっと良いことが起こりうることを知りますか?また、PSの発言に同意します。
グリーンパーカー

@Greenparker Null再発マルコフ連鎖には定常分布はありません。次に、MCMCのコンテキスト(ターゲット分布に等しい定常分布でマルコフ連鎖を構築する場合)では役に立たなく なります。たとえば、ここここを参照してください。
ロッド

5

上記のRodの優れた回答から、より応用された代替ビューを提供します-

ほとんどではないにしても、多くの場合、事後の不適切は、「自分の尤度関数と事前分布を完全に確信し、何が起こったのかを確かめる」ではなく、便宜上選択した結果です。効果。これを考えると、計算を台無しにしない限り、私たちは適用された仕事で不正を真剣に考えるべきではありません。有名な人(Huber?Tukey?)がかつて観察したように、異なるコンテキストで、標準のコーシーとコーシーの切り捨ての違いは+/10100 は検出できませんが、一方には瞬間がなく、もう一方にはすべての注文の瞬間があります。

これに関連して、次の週末にAT&Tパークでホットドッグの需要の事後分布がある場合、アッパーテールは 1/バツ、それは期待値を計算するアルゴリズムにとっては悪いニュースですが、サンフランシスコの推定人数で切り捨てると、来週末に実際にAT&Tパークで販売されるホットドッグの数よりもやや多い数になります。まあ、少なくとも瞬間の存在に関しては。後者の場合、実際の事前の一種の2段階のアプリケーションと考えることができます-上限のない計算に使用するものと、それに等しい「余分な機能」サンフランシスコの人口の上にゼロ...」、サンプルの生成に続くステップで「追加機能」が適用されます。実際の事前分布は、MCMC計算で使用されるものではありません(私の例では)。

したがって、原則として、適用作業で不適切な分布からMCMCで生成されたサンプルを使用しても大丈夫ですが、その不適切な処理がどのように発生し、ランダムサンプルがそれによってどのように影響を受けるかについて、多くの注意を払っています。理想的には、私のホットドッグの例のように、ランダムサンプルは影​​響を受けないでしょう。合理的な世界では、サンフランシスコの人々の数よりも多い乱数を実際に生成することはありません...

また、後から大量に切り捨てた場合(またはモデルに適切な変更を加えた場合でも)、結果が不適切な原因となった事後の機能に非常に敏感である可能性があることに注意する必要があります。 )後部を不適切なものから適切なものにシフトするわずかな変化に対して結果が堅牢であることを望みます。これを確認するのは難しいかもしれませんが、すべての結果、特に便宜上作成された仮定に対して結果が堅牢であることを確認するという大きな問題の一部です。


+1、興味深い戦術。また、実際の事前の切り捨てを提供することもできます。mcmcを実行するとき、これは計算の多くを禁止せず、近似の使用について議論する必要を避けるかもしれないと想像します。
推測

@conjectures-確かに、この場合!これは単純な例であり、a)MCMC計算で使用される事前分布と実際の事前分布との間に差がある場合があり、b)MCMCサンプルの後処理によって差が解決される可能性があるという点を説明するためのものです合理的な程度の「解決」)、およびc)MCMC計算で使用される事前の結果の不正は、後処理が行われた後の結果の不正を意味しません。
jbowman
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.