事後と事前および尤度とは非常に異なる


21

事前確率と尤度が互いに非常に異なる場合、事後がどちらにも似ていない状況が発生することがあります。たとえば、正規分布を使用するこの図を参照してください。

事後行動

これは数学的には正しいですが、私の直感とは一致していないようです-データが強く保持されている信念またはデータと一致しない場合、どちらの範囲もうまくいかないと予想し、フラットな後方範囲全体または恐らく事前確率と尤度周辺の二峰性分布(どちらがより論理的な意味を持っているかはわかりません)。私は確かに、私の以前の信念やデータのいずれにも一致しない範囲の周りのきつい後方を期待しないでしょう。より多くのデータが収集されると、事後確率が尤度に向かって移動することを理解していますが、この状況では直感に反するように思われます。

私の質問は次のとおりです。この状況に対する私の理解はどのように欠陥がありますか(または欠陥がありますか)。後部は、この状況の「正しい」関数です。そうでない場合、他にどのようにモデル化できますか?

完全を期すために、事前確率はとして与えられ、尤度はとして与えられます。Nμ = 6.1 σ = 0.4 Nμ=1.5σ=0.4Nμ=6.1σ=0.4

編集:与えられた答えのいくつかを見て、私は非常によく状況を説明していないように感じています。私のポイントは、ベイジアン解析は非直感的な結果をもたらすように思われた特定のモデルで仮定。私の望みは、おそらく悪いモデルの決定について、事後部が何らかの形で「説明」することでした。これについては、回答で詳しく説明します。


2
これは、単に事後の正常性を仮定できないことを意味します。後部が正常であると仮定した場合、これは確かに正しいでしょう。
PascalVKooten 14

事後については何も仮定せず、事前と可能性のみを仮定しました。いずれにせよ、分布の形式はここでは無関係のようです-私はそれらを手動で描くことができ、同じ事後が続きます。
ロナンデーリー

後部が正常であると仮定しない場合、この後部に対するあなたの信念を捨てると言っているだけです。正常な以前のデータと正常なデータを考えると、正常な事後は実際このようになります。おそらく、小さなデータを想像してください。実際には、このようなことが実際に発生する可能性があります。
PascalVKooten 14

1
この数字は正しいですか?以前の尤度は、重複しないため、0に非常に近いはずです。事前の重みが0に非常に近いため、後部がどのように覗くことができるかわかりません。何か不足していますか?×
ルカ

1
@Luca再正規化を忘れています。事前確率と尤度の積はゼロに近い、はい-しかし、それを再び1に統合するように正規化すると、これは無関係になります。
パット

回答:


5

はい、この状況は発生する可能性があり、モデリングの前提、特に事前モデルおよびサンプリングモデルの正規性(尤度)の特徴です。代わりに、事前にコーシー分布を選択した場合、事後分布は大きく異なります。

prior = function(x) dcauchy(x, 1.5, 0.4)
like = function(x) dnorm(x,6.1,.4)

# Posterior
propto = function(x) prior(x)*like(x)
d = integrate(propto, -Inf, Inf)
post = function(x) propto(x)/d$value

# Plot
par(mar=c(0,0,0,0)+.1, lwd=2)
curve(like, 0, 8, col="red", axes=F, frame=T)
curve(prior, add=TRUE, col="blue")
curve(post, add=TRUE, col="seagreen")
legend("bottomleft", c("Prior","Likelihood","Posterior"), col=c("blue","red","seagreen"), lty=1, bg="white")

コーシー事前、通常のサンプリングモデル


@jaradniemiの回答に感謝します。コーシーの事前知識は、質問で与えられた特定の状況を常に回避すると思いますか?
ロナンデーリー14

1
はい。一般に、テールの重い事前分布により、データは事前​​分布を簡単に圧倒できます。
ジャラドニエミ14年

2
ジャラドニエミ、そうかもしれませんが、前部が後部に影響を与えたくないと言った場合、なぜ最初に有益な前部を選択するのですか?有益なように見えるので、コーチを選択することを提案しているようですが、実際にはそうではありません。
フロリアンハーティグ

1
事前確率と尤度が一致する場合、事前から事後まで精度の望ましい増加が得られるため、事前は有益です。しかし、太い尾を持つ事前分布を選択すると、2つが一致しない場合に簡単に優先順位を圧倒する可能性があります。
ジャラドニエミ

2

私はこれまでに与えられた答えに幾分反対します-この状況について奇妙なことは何もありません。とにかく、可能性は漸近的に正常であり、正常な事前確率はまったく珍しいことではありません。事前と尤度が同じ答えを与えないという事実で、両方をまとめると、ここで話している状況があります。以下に、jaradniemiのコードでそれを示しました。

そのような観察の通常の結論は、a)モデルが構造的に間違っている、b)データが間違っている、c)事前が間違っている、ということです1に言及します。しかし、確かに何かが間違っており、何らかの事後予測チェックを行う場合にもこれが表示されます。

1 Hartig、F .; ダイク、J .; ヒックラー、T .; ヒギンズ、SI; オハラ、RB; Scheiter、S.&Huth、A.(2012)データへの動的植生モデルの接続-逆の視点。J. Biogeogr。、39、2240-2252。http://onlinelibrary.wiley.com/doi/10.1111/j.1365-2699.2012.02745.x/abstract

prior = function(x) dnorm(x,1,.3)
like = function(x) dnorm(x,-1,.3)

# Posterior
propto = function(x) prior(x)*like(x)
d = integrate(propto, -Inf, Inf)
post = function(x) propto(x)/d$value

# Plot
par(mar=c(0,0,0,0)+.1, lwd=2)
curve(like, -2, 2, col="red", axes=F, frame=T, ylim = c(0,2))
curve(prior, add=TRUE, col="blue")
curve(post, add=TRUE, col="seagreen")
legend("bottomleft", c("Prior","Likelihood","Posterior"), col=c("blue","red","seagreen"), lty=1, bg="white")

ここに画像の説明を入力してください


2

この質問に関して私が探していた答えは、Bayesian Biostatisticsの LesaffreとLawsonによって最もよく要約されているように感じます

後方精度は、すなわち、前とサンプル精度の合計である:

1σ2=w0+w1
μσ

これが私にとって要約し、他の回答で大まかに概説されていることは、通常の尤度で通常の事前確率をモデリングする場合、事後がどちらよりも正確な状況になる可能性があるということです。これは直感に反しますが、これらの要素をこのようにモデリングすることの特別な結果です。


これは、Fisher行列を使用して高次元で一般化します。ピーク付近の事後分布の対数尤度のヘッセ行列は、事前共分散と尤度逆共分散の合計です。この合計の逆数は、事後の共分散です。2つの正(半)定行列(逆共分散)が追加されるため、事後確率の精度が事前確率分布または尤度確率分布の精度を超えることが数学的に保証されます。これは、ベイジアンフレームワークの普遍的な結果です。
T3am5hark

2

バツ1バツ0μN1.60.42バツ1Nμ0.42バツ1バツ10.42+0.42=0.562ϕ6.11.6/0.56=9.31016μ

バツ0Nμ0.42バツ0バツ0バツ1|バツ1バツ0|>6.11.6

バツ0バツ1


1

しばらくこれについて考えた後、私の結論は、悪いモデリングの仮定では、事後は以前の信念や可能性のいずれとも一致しない結果になる可能性があるということです。これから、自然な結果は、事後ではなく、一般に、分析の終わりです。事後データがデータにほぼ適合している場合、または事前確率と尤度の間で拡散する必要がある場合(この場合)、事後予測チェックなどで、事後チェックする必要があります。同様。これをモデルに組み込むには、確率的ステートメントに確率をかける能力が必要と思われますが、それは不可能だと思います。


はい、私は同意します、私のより詳細な答えを参照してください
フロリアンハーティグ

0

これは実に興味深い質問だと思います。それで寝ていたので、私は答えに刺し傷があると思います。主な問題は次のとおりです。

  • 尤度をガウスpdfとして扱いました。しかし、それは確率分布ではありません-可能性です!さらに、軸に明確なラベルを付けていません。これらのことを組み合わせることで、後続のすべてが混乱しました。

μσPμ|μσμσPバツ|μσバツPμ|バツσμσμ

μPバツ|μ

Pμ|μσ=eバツpμμ22σ212πσ2

Pバツ|μσ==1Neバツpバツμ22σ212πσ2

σ2=σ2/Nσ2Nバツ

したがって、事前確率と尤度は等しく有益です。なぜ後部は二峰性ではないのですか?これは、モデリングの前提によるものです。これが設定された方法(通常の事前、通常の尤度)で暗黙的に正規分布を仮定し、事後を制約して単峰性の答えを与えました。それは、正規分布の単なる特性であり、それらを使用することで問題に焼き付けました。別のモデルが必ずしもこれを行うとは限りません。私は、コーチ分布がマルチモーダルの尤度、したがってマルチモーダルの事後分布を持つ可能性があると感じています(今のところ証拠はありませんが)。

したがって、私たちは単峰性でなければならず、事前確率は尤度と同じくらい有益です。これらの制約の下で、最も賢明な推定値は、どちらを信じるべきかを判断する合理的な方法がないため、尤度と事前の間にある点のように聞こえ始めています。しかし、なぜ後部はよりきつくなるのでしょうか?

σμσσσμ

(視覚化する方法は、2つのサンプルポイントを使用して、既知の分散でガウス平均を推定することを想像することです。2つのサンプルポイントがガウスの幅よりもはるかに大きい場合(つまり、平均値が実際にそれらの間にあることを示す強力な証拠です。この位置から平均値をわずかにずらすと、サンプルの確率が指数関数的に低下します。)

要約すると、説明した状況は少し奇妙であり、このモデルを使用することで、自分が気付いていなかった問題にいくつかの仮定(単峰性など)を含めました。しかし、そうでなければ、結論は正しいです。


μσσμ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.