ベイズ推定では、なぜ一部の項が事後予測から除外されるのですか?


12

ケビンマーフィーのガウス分布共役ベイズ分析では、事後予測分布は

p(xD)=p(xθ)p(θD)dθ

ここで、はモデルが適合するデータであり、は見えないデータです。私が理解していないのは、積分の最初の項でへの依存がなくなる理由です。確率の基本的なルールを使用して、私は期待したでしょう:DxD

p(a)=p(ac)p(c)dcp(ab)=p(ac,b)p(cb)dcp(xD)=p(xθ,D)p(θD)dθ

質問:用語への依存がなくなるのはなぜですか?D


それだけの価値があるので、この種の定式化(条件付きの変数を削除する)の他の場所を見てきました。たとえば、Ryan AdamのBayesian Online Changepoint Detectionでは、事後予測を次のように書いています。

p(xt+1rt)=p(xt+1θ)p(θrt,xt)dθ

ここでも、、期待していましたD={xt,rt}

p(xt+1xt,rt)=p(xt+1θ,xt,rt)p(θrt,xt)dθ

回答:


13

これは、与えられた場合、は条件付きでから独立しているという仮定に基づいています。これは、トレーニングデータとテストデータ(それぞれと)が、未知のパラメーターの同じセットから独立して生成されることを示しているため、多くの場合、これは妥当な仮定です。この独立性の仮定を前提として、なので、は予想したより一般的な形から外れます。xDθDxθp(x|θ,D)=p(x|θ)D

2番目の例では、同様の独立性の仮定が適用されているように見えますが、今は(明示的に)時間の経過に伴います。これらの仮定は、テキストの他の場所で明示的に述べられているか、または問題のコンテキストに十分に精通している人には暗黙のうちに明白である可能性があります(ただし、特定の例では必ずしもそうではありませんが、 -著者はこの親しみやすさを想定するのが正しかった)


9

これは、与えられた場合、はから独立していると想定されるためです。言い換えると、すべてのデータは、パラメーター持つ正規分布からのiidであると見なされます。いったんからの情報を使用して考慮される、という多くの情報がない新しいデータポイントについての私達を与える。したがって、です。xDθθθDDxp(x|θ,D)=p(x|θ)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.