これは中間試験の練習問題です。問題はEMアルゴリズムの例です。(f)の部分で困っています。(a)から(e)までのパーツをリストアップして、前に間違えた場合に備えて完成させます。
ましょレートを持つ独立した指数確率変数もθ。残念ながら、実際のX値は観測されず、X値が特定の間隔内にあるかどうかのみが観測されます。ましょうG 1 、J = 1 { X J < 1 }、G 2 、J = 1 { 1 < X J < 2 }、及びG 3 、J = 1 {X1,…,XnθXXG1j=1{Xj<1}G2j=1{1<Xj<2} (j=1、…、nの場合)。観測されたデータは( G 1 j、 G 2 j、 G 3 j)で構成されています。G3j=1{Xj>2}j=1,…,n(G1j,G2j,G3j)
(a)観測されたデータの可能性を与える:
L(θ|G)=∏j=1nPr{Xj<1}G1jPr{1<Xj<2}G2jPr{Xj>2}G3j=∏j=1n( 1 − e- θ)G1 j(e- θ− e- 2 θ)G2 j(e- 2 θ)G3 j
(b)完全なデータ尤度を与える
L (θ | X、G )= ∏j = 1ん( θ E- θ Xj)G1 j( θ E- θ Xj)G2 j( θ E- θ Xj)G3 j
(c)潜在変数f (x j | G 、θ )の予測密度を導出するf(xj| G、θ)
f(xj|G,θ)=fX,G(xj,g)fG(g)=θe−θxj1{xj∈region r s.t. Grj=1}(1−e−θ)g1j(e−θ−e−2θ)g2j(e−2θ)g3j
(d)Eステップ。関数与えるQ(θ,θi)
Q(θ,θi)=EX|G,θi[logf(x|G,θ)]=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)−N2log(e−θ−e−2θ)−N3loge−2θ=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)−N2log(e−θ(1−e−θ))+2θN3=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)+θN2−N2log(1−e−θ)+2θN3
ここで、N1=∑nj=1g1j,N2=∑nj=1g2j,N3=∑nj=1g3j
(e)式を与える[ X j | Gのr個のJ = 1 、θ I ]のために、R = 1 、2 、3。E[Xj|Grj=1,θi]r=1,2,3
私はかなり正しいと私が確信している私の結果をリストしますが、このすでにやっかいな質問の導出は少し長くなるでしょう:
E[Xj|G1j=1,θi]E[Xj|G2j=1,θi]E[Xj|G3j=1,θi]=(11−e−θi)(1θi−e−θi(1+1/θi))=(1e−θi−e−2θi)(e−θi(1+1/θi)−e−2θi(2+1/θi))=(1e−2θi)(e−2θi(2+1/θi))
これは私が行き詰まっている部分であり、それは以前の間違いが原因である可能性があります:
(f)M-ステップ。検索最大限Q (θ 、θ Iを)θQ(θ,θi)
総期待の法則から、
そのためE[Xj|G,θi]=(1θi−e−θi(1+1/θi))+(e−θi(1+1/θi)−e−2θi(2+1/θi))+(e−2θi(2+1/θi))=1/θi
Q(θ,θi)∂Q(θ,θi)∂θ=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)+θN2−N2log(1−e−θ)+2θN3=nlogθ−θnθi−N1log(1−e−θ)+θN2−N2log(1−e−θ)+2θN3=nθ−nθi−(N1+N2)e−θ1−e−θ+N2+2N3
θθ