不適切な事前はどのようにして適切な事後分布に導くことができますか?


22

適切な事前配布の場合、

P(θX)=P(Xθ)P(θ)P(X)

P(Xθ)P(θ)

このステップのための通常の正当化は、周辺分布することである、、に対して一定であると事後分布を導出する際に、したがって無視することができます。XP(X)θ

しかし、不適切な事前分布の場合、事後分布が実際に存在することをどのように知っていますか?この一見円形の議論には何かが欠けているようです。つまり、事後が存在すると仮定した場合、事後を導出する方法のメカニズムは理解しますが、事後が存在する理由についての理論的正当性が欠落しているようです。

PS私はまた、不適切な事前が不適切な事後につながる場合があることを認識しています。

回答:


16

私たちは、一般的に不適切な事前分布から事後承諾π(θ)の場合を

π(Xθ)π(θ)π(X)
存在し、有効な確率分布です(つまり、サポートを介して1に正確に統合されます)。基本的にこれはつまるところπ(X)=π(Xθ)π(θ)dθ有限であること。このような場合は、我々は、この数量を呼び出しπ(θX)受け入れる私たちが望むことを事後分布としてそれを。ただし、これは事後分布ではなく、条件付き確率分布でもないことに注意することが重要です(これらの2つの用語はここでの文脈では同義です)。

さて、私は上記の不適切な事前分布から「事後」分布を受け入れると言いました。それらが受け入れられる理由は、前のがまだパラメーター空間の相対的な「スコア」を与えるためです。すなわち、比π θ 1π(θ)我々の分析に意味をもたらします。場合によっては不適切な事前分布から得られる意味は、適切な事前分布では利用できない場合があります。これは、それらを使用するための潜在的な正当化です。不適切な事前事態に対する実際的な動機付けのより徹底的な調査については、Sergioの回答を参照してください。π(θ1)π(θ2)

この量のことを指摘し、それの価値望ましい理論特性ならびに、持っていないDegroot&Schervishをπ(θX)

不適切な事前分布は真の確率分布ではありませんが、そうであるふりをする場合、事前ハイパーパラメーターの極値を持つ適切な共役事前分布を使用して取得した事後分布を近似する事後分布を計算します。


私はあなたの答えの中のいくつかのことに混乱しています。あなたは、上記が有限である場合、後輩を受け入れると言います。その積分が有限でない場合、事後は有限ではないということですか?また、この場合は事後を使用しているように見えますが、実際の分布ではありません。それが実際の分布である場合はありませんか?また、事前の比率はこれと何の関係がありますか?接続が表示されません。
ベンエリザベス区

場合@BenElizabethWard 存在している、そして、積分π Xは存在している必要があります(したがって、有限で)。contrapositiveも同様に真である:場合π Xが(無限大)が存在しない場合、π θ | Xは存在しません。それはそれは、有効な確率分布を存在している場合にはπ θ | X の確率分布です。ただし、与えられたデータ尤度を持つπ θ )の事後分布ではありませんπ(θX)π(X)π(X)π(θX)π(θX)π(θ)。その事前分布の事後は存在しません。我々は受け入れる π θ | X 、それは近似値であるため、我々の分析では。π(Xθ)π(θX)

1
@BenElizabethWardこの比率は、適切な事前情報にロードできない可能性のある有用な情報が事前情報に含まれていることを示すために使用されました。これを含めるように回答を編集します。

2
@jsk の確率分布ではなく、事後分布の定義は、その必要がπ θはそれがコールに浮気だので、確率分布でπ θ | X 、それは確率分布であるとき、事後分布を。Degroot&Schervishは、「..我々は事後分布を計算します。」と言います。これにより、引用で前述したように、「[不適切な事前分布]が[適切な事前分布]であるふりをすることに同意したと仮定します。π(θ)π(θ)π(θX)

1
将来の読者がこのコメント交換を読む必要がないように、回答を完全かつ自己完結型にするために、回答を更新しますか?
jsk

9

「理論的な」答えと「実用的な」答えがあります。

理論的な観点からは、事前確率が不適切な場合、事後確率は存在しません(まあ、より健全な声明についてはマシューの答えを見てください)が、限定的な形で近似される場合があります。

データは、パラメータとベルヌーイ分布から条件付きIIDサンプルを含む場合、およびθはパラメータを持つベータ分布有し、α及びβを、の事後分布θはベータパラメータを有する分布であるα + S β + N - Snは観測値、s成功)およびその平均はα + s /α + β + n θθαβθα+s,β+nsns(α+s)/(α+β+n)。我々は前にhypeparametersで前不適切な(と非現実)ベータ分布を使用する場合は、及びそのふりπをθ α θ - 11 - θ - 1、我々が得る適切な事後比例にθ sの- 11 - θ N - S - 1、すなわちパラメータを持つベータ分布のPDF S及びN - Sα=β=0π(θ)θ1(1θ)1θs1(1θ)ns1sns定数係数を除きます。これは、パラメーターおよびβ 0のベータ事前分布の事後の制限形式です(Degroot&Schervish、Example 7.3.13)。α0β0

平均の通常モデルでは、公知の分散σ 2、及びNμ 0τ 2 0のための事前分布θ、先行精度場合、1 / τ 2 0は、データ精度に対して小さい、N / σ 2は、事後分布がほぼ同じであればτ 2 0 = P θ | X Nθ | ˉθσ2N(μ0,τ02)θ1/τ02n/σ2τ02= 、すなわち事後分布が仮定から生じるものであり、約Pθをするための定数に比例したθ-、厳密には不可能である分布が、限定形後方からτ 2つの0アプローチが存在しない(ゲルマンら、P。52)。

p(θx)N(θx¯,σ2/n)
p(θ)θ(,)τ02

ビューの"実用的"観点から、、P X | θ = 0どんなP θがなので、もしP X | θ 0A B 、その後、- P X | θ P θp(xθ)p(θ)=0p(xθ)=0p(θ)p(xθ)0(a,b)。不適切な事前分布を使用して、a b など、尤度が認識できる領域での事前分布の局所的な挙動を表すことができます。十分近似する前には以下のような形態は以下のことを仮定することにより、F X = K X - 又は Fをp(xθ)p(θ)dθ=abp(xθ)p(θ)dθ(a,b)f(x)=k,x(,)のみにわたってB 、範囲、我々は(実際に使用する事前確率が適正であることを確認それゼロ外部に好適テールことことをボックスとTiao、P 21。 )。事前分布もしそうなら θがある U- が、 bは制限され、それがあるかのようである θ Uf(x)=kx1,x(0,)(a,b)θU(,)(a,b)、すなわち P X | θ P θ = P X | θ K α P X | θ 。具体的な例として、これはスタンで発生することです。パラメータに事前分布が指定されていない場合、暗黙的にサポートの均一な事前分布が与えられ、これは尤度と定数の乗算として処理されます。θU(a,b)p(xθ)p(θ)=p(xθ)kp(xθ)


理論的な観点から、なぜ存在しないのかについて詳しく説明していただけますか?
jsk

彼の答えとコメントでマシューよりもうまく説明できませんでした。
セルジオ

実用的なセクションでは、yとは何ですか?また、そのセクションでは、いくつかの必要がありの用語は、尤度もP X | θ p(θx)p(xθ)
jsk

ありがとう。もう1つ間違いがあるかもしれないと思います... 書きますが、事前確率はxに依存できません。やるあなたの平均P θ = K θ - 1P(θ)=kx1xP(θ)=kθ1
jsk

右!Box&Tiaoにある式を書き直しました。私は、均質な表記法を選択しようとしていた(例えばゲルマンは使用していますするのではなく、X、DeGrootの用途ξ 事前分布と事後など)が、私は...混乱に感謝してしまいました!yxξ(.)
セルジオ

2

しかし、不適切な事前分布の場合、事後分布が実際に存在することをどのように知っていますか?

後部も適切でない可能性があります。事前確率が不適切であり、尤度が平坦である場合(有意な観測がないため)、事後確率は事前確率に等しく、また不適切です。

通常、いくつかの観測があり、通常、尤度は平坦ではないため、事後は適切です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.