Normal-Wishart後部の派生


11

Normal-Wishart事後の導出に取り組んでいますが、パラメーターの1つ(スケールマトリックスの事後、下部を参照)で行き詰まっています。

コンテキストと完全性のために、ここにモデルと残りの派生があります:

xiN(μ,Λ)μN(μ0,(κ0Λ)1)ΛW(υ0,W0)

(比例定数まで)3つの要因のそれぞれの展開形式は次のとおりです。

  • 可能性:

    N(xi|μ,Λ)|Λ|N/2exp(12i=1N(xiTΛxi2μTΛxi+μTΛμ))
  • 以前の通常:

    N(μ|(μ0,κ0Λ)1)|Λ|1/2exp(12(μTκ0Λμ2μTκ0Λμ0+μ0Tκ0Λμ0))
  • 以前のWishart:

    W(Λ|υ0,W0)|Λ|υ0D12exp(12tr(W01Λ))

次のように分解できる後部Normal-Wishart()が必要です同様に:μ,Λ|μ,κ,υ,WN(μ|μ,κΛ)W(Λ|υ,W)

自由の堕落υ

可能性の最初の因子とウィシャートをマージすることにより、後部のウィシャート因子の最初の因子が得られます: なので、事後の最初のパラメーターがあります。

|Λ|υ0+ND12
υ=υ0+N

スケールファクターκ

と囲まれた要素を特定して、前のが尤度によって更新されたかを確認し: ため、2番目のパラメーターを取得しました: μTμκ0Λ

μT((κ0+N)Λ)μ
κ=κ0+N

平均μ

3番目のパラメーターは、内にあるものを識別することから得られ: したがって、3番目のパラメーターを取得しました: 2μT...

2μT(ΛNx¯+κ0Λμ0)=2μTκΛμ(ΛNx¯+κ0Λμ0)=κΛμ(Nx¯+κ0μ0)=κμ
μ=1k(Nx¯+κ0μ0)

スケールマトリックスW

そして、4番目のパラメーターは、残りのパラメーターの作業から得られます:

tr(W1Λ)=tr(W01Λ)+i=1NxiTΛxi+μ0Tκ0Λμ0=tr(W01Λ)+i=1Ntr(xiTΛxi)+tr(μ0Tκ0Λμ0)=tr(W01Λ+i=1NxiTΛxi+μ0Tκ0Λμ0)

ここから先に進み(これまでに間違いがなかった場合)、標準ソリューションを取得するにはどうすればよいですか。W

編集1

次に、標準解のように2つの正方形を取得するために、用語を再配置し、いくつかの要因を加算および減算します。

tr(W1Λ)=tr(W1Λ+i=1N(xiTΛxi+x¯TΛx¯2xiTΛx¯)+κ0(μ0TΛμ0+x¯TΛx¯2x¯TΛμ0)i=1Nx¯TΛx¯+2i=1NxiTΛx¯κ0x¯TΛx¯+2κ0x¯TΛμ0)=tr(W1Λ+i=1N(xix¯)Λ(xix¯)T+κ0(x¯μ0)Λ(x¯μ0)TNx¯Λx¯T+2Nx¯Λx¯Tκ0x¯Λx¯T+2κ0x¯Λμ0T)

正方形の外に残る要因を単純化し:

tr(W1Λ)=tr(W1Λ+i=1N(xix¯)TΛ(xix¯)+κ0(x¯μ0)TΛ(x¯μ0)+(Nκ0)x¯TΛx¯+2κ0x¯TΛμ0)

編集2@bdeonovicの回答のおかげでフォローアップ

トレースは循環的であるため、です。次に、 次に、 tr(ABC)=tr(BCA)=tr(CAB)

tr(W1Λ)=tr(W1Λ+i=1N(xix¯)(xix¯)TΛ+κ0(x¯μ0)(x¯μ0)TΛ+(Nκ0)x¯x¯TΛ+2κ0x¯μ0TΛ)
tr(W1)=tr(W1+i=1N(xix¯)(xix¯)T+κ0(x¯μ0)(x¯μ0)T+(Nκ0)x¯x¯T+2κ0x¯μ0T)

ほとんど!しかし、まだそこにはありません。目標は次のとおりです。

W1+i=1N(xix¯)(xix¯)T+κ0Nκ0+N(x¯μ0)(x¯μ0)T

回答:


4

トレースは循環的であるため、です。また、トレースは加算で分散されるため、ます。これらの事実により、トレース用語で用語を後ろに循環させ、トレース用語を組み合わせることができるはずです。結果はtr(ABC)=tr(BCA)=tr(CAB)tr(A+B)=tr(A)+tr(B)Λ

W1=W1+i=1Nxixi+μ0μ0

ありがとう!まだ、そこからとを含む標準結果(en.wikipedia.org/wiki/Conjugate_prior)に到達する方法がわかりません。私は否定的な兆候さえ持っていません:O(xix¯)x¯μ0
アルベルト

3

以前の可能性は ×

|Λ|N/2exp{12(i=1NxiTΛxiNx¯TΛμμTΛNx¯+NμTΛμ)}×|Λ|(ν0D1)/2exp{12tr(W01Λ)}×|Λ|1/2exp{κ02(μTΛμμTΛμ0μ0TΛμ+μ0TΛμ0)}.
これは、ように書き換えられます 書き換えることができます
|Λ|1/2|Λ|(ν0+ND1)/2×exp{12((κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ))}
(κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ)
、次のように項を加算および減算することにより、
(κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ).
上の2行は次のように因数分解します
(κ0+N)(μκ0μ+Nx¯κ0+N)TΛ(μκ0μ+Nx¯κ0+N).

を加算および減算すると、次のようになります は次のように書き換えられます Nx¯TΛx¯

1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ)
i=1N(xiTΛxixiTΛx¯x¯TΛxi+x¯TΛx¯)+Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+tr(W01Λ).
合計項
i=1N(xiTΛxixiTΛx¯x¯TΛxi+x¯TΛx¯)
equals 今 は次のように展開できます
i=1N(xix¯)TΛ(xix¯).
Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)
Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ02μ0TΛμ0+Nκ0μ0TΛx¯0+Nκ0x¯TΛμ0+N2x¯TΛx¯),
これは
Nκ0κ0+N(x¯TΛx¯x¯TΛμ0μ0TΛx¯+μ0TΛμ0)=Nκ0κ0+N(x¯μ0)TΛ(x¯μ0).

次の2つの用語はスカラーです: そして、すべてのスカラーはそのトレースに等しいため、

i=1N(xix¯)TΛ(xix¯),Nκ0κ0+N(x¯μ0)TΛ(x¯μ0).
tr(W01Λ)+i=1N(xix¯)TΛ(xix¯)+Nκ0κ0+N(x¯μ0)TΛ(x¯μ0)
以下のように書き換えることができる 以降、上記和等号
tr(W01Λ)+tr(i=1N(xix¯)TΛ(xix¯))+tr(Nκ0κ0+N(x¯μ0)TΛ(x¯μ0)).
tr(ABC)=tr(CAB)
tr(W01Λ)+tr(i=1N(xix¯)(xix¯)TΛ)+tr(Nκ0κ0+N(x¯μ0)(x¯μ0)TΛ).
で あるという事実を使用して、合計を次のように書き換えることができます tr(A+B)=tr(A)+tr(B)
tr(W01Λ+i=1N(xix¯)(xix¯)TΛ+Nκ0κ0+N(x¯μ0)(x¯μ0)TΛ)=tr((W01+i=1N(xix¯)(xix¯)T+Nκ0κ0+N(x¯μ0)(x¯μ0)T)Λ).

我々が許可すれば、その一緒にすべてを置く以前のの可能性は S=i=1N(xix¯)(xix¯)T×

|Λ|1/2exp{κ0+N2(μκ0μ+Nx¯κ0+N)TΛ(μκ0μ+Nx¯κ0+N)}×|Λ|(ν0+ND1)/2exp{12tr((W01+S+Nκ0κ0+N(x¯μ0)(x¯μ0)T)Λ)},
必要に応じて。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.