新しいデータによるベイジアン更新


17

n個のデータポイントを観察した後、事前のN〜(a、b)で事後を計算するにはどうすればよいですか?データポイントのサンプル平均と分散を計算し、事後と事前を結合する何らかの計算を行う必要があると思いますが、結合式がどのように見えるかはよくわかりません。

回答:


22

ベイジアン更新の基本的な考え方は、データと、対象のパラメーターθに対する事前分布が与えられ、データとパラメーターの関係が尤度関数を使用して記述される場合、ベイズの定理を使用して事後を取得することですXθ

p(θX)p(Xθ)p(θ)

これは、最初のデータポイントを見た後場合は、連続的に行うことができますθがに更新となり、後方θ "あなたは第二のデータポイント取ることができます隣に、X 2及び使用を後部前に得られたθ "あなたと前に再びなどそれを更新するために、x1 θ θx2θ

例を挙げましょう。あなたが平均を推定することを想像して正規分布とのσ 2があなたに知られています。そのような場合、normal-normalモデルを使用できます。私たちは、のために、通常の前に前提とμハイパーとμ 0σ 2 0μσ2μμ0,σ02:

XμNormal(μ, σ2)μNormal(μ0, σ02)

正規分布であるため、前のコンジュゲートするためのの正規分布の、我々が前に更新するために閉形式解を有しますμ

E(μx)=σ2μ+σ02xσ2+σ02Var(μx)=σ2σ02σ2+σ02

残念ながら、このような単純な閉形式のソリューションは、より高度な問題には利用できず、最適化アルゴリズム(最大事後アプローチを使用したポイント推定)またはMCMCシミュレーションに依存する必要があります。

以下にデータ例を示します:

n <- 1000
set.seed(123)
x     <- rnorm(n, 1.4, 2.7)
mu    <- numeric(n)
sigma <- numeric(n)

mu[1]    <- (10000*x[i] + (2.7^2)*0)/(10000+2.7^2)
sigma[1] <- (10000*2.7^2)/(10000+2.7^2)
for (i in 2:n) {
  mu[i]    <- ( sigma[i-1]*x[i] + (2.7^2)*mu[i-1] )/(sigma[i-1]+2.7^2)
  sigma[i] <- ( sigma[i-1]*2.7^2                  )/(sigma[i-1]+2.7^2)
}

結果をプロットすると、新しいデータが蓄積されるにつれて、事後値が推定値にどのように近づくかがわかります(真の値は赤い線でマークされています)。

normal-normalモデルの後続のステップで事前に更新する

詳細については、これらのスライドとケビンP.マーフィーによるガウス分布論文の共役ベイズ分析を確認できます。また、サンプルサイズが大きい場合、ベイジアン事前分布は無関係になりますか?また、これらのメモこのブログエントリを確認し、ベイジアン推論へのアクセス可能な段階的な紹介を確認することもできます。


ありがとう、これはとても助かります。この単純な例(あなたの例とは異なり、未知の分散)をどのように解決しますか?N〜(5、4)の事前分布があり、5つのデータポイント(8、9、10、8、7)を観測するとします。これらの観察の後、後部は何でしょうか?前もって感謝します。大変感謝いたします。
statstudent

@Kellyの場合、分散のいずれかが不明で既知の意味を持つ場合、または両方が共役事前分布と回答の最後に提供したリンクに関するWikipediaエントリで不明な場合の例を見つけることができます。平均と分散の両方が不明な場合、それはわずかに複雑になります。
ティム

@Kellyところで、あなたは確認することができ、ここで、両方の推定の例については、σ 2をμσ2
ティム

4

あなたが前に持っている場合はと尤度関数P X | θをあなたが後方に計算することができます。P(θ)P(xθ)

P(θx)=θP(xθ)P(θ)P(x)

以来一つに確率の合計を作るためだけの正規化定数であり、あなたが書くことができます:P(x)

P(θx)θP(xθ)P(θ)

ここでは「に比例」を意味します。

共役事前分布の場合(よく閉じた形式の式が得られる場合)

共役事前分布に関するこのウィキペディアの記事は参考になるかもしれません。してみましょうあなたのパラメータのベクトルです。してみましょうP θはあなたのパラメータを超える前にです。レッツP X | θ 尤度関数、パラメータが与えられたデータの確率があること。以前ならば前には、尤度関数の共役前にあるP θ 後部P θ | xは同じ家族(。例えば、両方のガウス)です。θP(θ)P(xθ)P(θ) P(θx)

共役分布の表は、いくつかの直観を構築するのに役立ちます(また、自分自身で作業するためのいくつかの有益な例を示します)。


1

これは、ベイジアンデータ分析の中心的な計算の問題です。それは本当に関係するデータと分布に依存します。すべてが閉じた形式で表現できる単純な場合(共役事前分布など)、ベイズの定理を直接使用できます。より複雑なケースで最も人気のある技術ファミリは、マルコフ連鎖モンテカルロ法です。詳細については、ベイジアンデータ分析の入門書をご覧ください。


どうもありがとうございます!これが本当に愚かなフォローアップの質問であれば申し訳ありませんが、あなたが言及した単純なケースでは、ベイズの定理を直接どのように正確に使用しますか?サンプル平均とデータポイントの分散によって作成された分布は、尤度関数になりますか?どうもありがとうございました。
statstudent

@Kelly繰り返しますが、それはディストリビューションに依存します。例えばen.wikipedia.org/wiki/Conjugate_prior#Exampleを参照してください。(質問に答えた場合は、投票矢印の下にあるチェックマークをクリックして答えを受け入れることを忘れないでください。)
Kodiologist
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.