私が見つかりました。これらのノートは、補足資料で何が起こっていたかを考え出すのに非常に役立ちます。
継続性のために、これらの質問に少し順序を乱して答えます。
まず、なぜそれが
θ(0 )≠ θ(1 )
g0ログ(P(x ; θ ))θ(0 ) G 0 θθ(1 )g0θ
第二に、なぜ不平等が厳しいのか
Q (z)= P(z| x; θ)
これに関する脚注には、
確率変数が確率1で一定の場合(つまり、場合にのみ、等式が成立します。y= E[ y]
選択ことを意味しますQP(x 、z; θ )Q (z)
P(x 、z; θ )= P(z| x; θ)P(x ; θ )
私たちの分数になります
P(z| x; θ)P(x ; θ )P(z| x; θ)= P(x ; θ )
P(x ; θ )zC
ログ( ΣzQ (z)C) ≥ΣzQ (z)ログ(C)
ここから、定数の期待値は重み(関係なくその定数になるので、2つの辺が等しいことがすぐにわかります。Q (z)
gt
私がリンクしたノートで与えられた答えは、補足ノートの答えとは少し異なりますが、それらは定数だけが異なり、最大化しているため、重要ではありません。注の1つ(派生あり)は次のとおりです。
gt(θ)=log(P(x|θ(t)))+∑zP(z|x;θ(t))log(P(x|z;θ)P(z|θ)P(z|x;θ(t))P(x|θ(t)))
この複雑な式は補足ノートでは詳しく説明されていません。おそらくこれらの用語の多くは定数であり、最大化すると破棄されます。私たちが最初にここに到着する方法に興味がある場合は、リンクしたメモをお勧めします。
gt(θ(t))gt(θ(t))=logP(x|θ(t))