EM、直感的な説明はありますか？

EMプロシージャは、多少の黒魔術として、未経験者には現れます。監視されたデータを使用して、HMMのパラメーターを推定します（たとえば）。次に、前後にタグ付けされたデータをデコードし、データが多少ともタグ付けされているかのようにイベントを「カウント」します。なぜこれがモデルを改善するのですか？私は数学について何かを知っていますが、私はそれのある種の精神的な絵を望み続けます。

expectation-maximization intuition

— bmargulies
ソース

確かではありませんが、確率的勾配降下最適化手順として解釈することは可能だと思います。私は...それについて考えましょう

— ロビンはジラール

タイピングを保存するために、観測データ、欠落データ（HMMの隠れ状態など）、およびを見つけようとしているパラメーターベクトル（遷移/放出確率など）を呼び出します。 $X$ $Z$ $Q$

直感的な説明は、私たちが知っている瞬間をふり、我々は基本的にだますことです私たちは順番に私たちがためのMLE見つけることができますことをZの条件付き分布を見つけることができるように（一瞬、我々は基本的に円形作っているという事実を無視します引数）、それから私たちがだましたことを認め、新しい、より良い値を入れて、もうだまされる必要がなくなるまでやり直します。 $Q$ $Q$ $Q$

少し技術的には、実際の値を知っているふりをすることにより、条件付き分布について何かを知っているふりをすることができます私たちは私たちの見積もり向上させることができます、我々は今の本当の価値であるふり、我々はの条件付き分布について何か知っているふりをすることができるように私たちは私たちの見積もり向上させることができます、、...というようにします。 $Q$ $Z|\{X,Q\}$ $Q$ $Q$ $Z|\{X,Q\}$ $Q$

さらに技術的には、を知っていれば、を最大化して正しい答えを得ることができ。問題は、わからないことであり、推定はそれに依存する必要があります。しかし、の最適な推定値（または分布）を見つけるには、とを知る必要があります。独自のマキシマイザーが分析的に必要な場合、鶏と卵の状況に陥ります。 $Z$ $\log(f(Q|X,Z))$ $Z$ $Q$ $Z$ $X$ $Q$

「アウト」とは、推定値（と呼ぶ）、の分布を見つけることができることですであるため、予想される対数尤度を最大化できますの条件付分布に関して、。この条件付き分布は、基本的に、与えられた現在の値にどのように依存するかを示しています。 $Q$ $Q_n$ $Z|\{Q_n,X\}$ $Q|\{X,Z\}$ $Z|\{Q_n,X\}$ $Z$ $Q$ $X$ 、と私たちは変更する方法を知ることができます両方のために私たちの可能性を高めるためにとの特定の値のため、同時に（私たちが呼んでいることを）。新しいを選択すると、条件付き分布が異なりますなので、期待値を再計算する必要があります。 $Q$ $Q$ $Z$ $Q$ $Q_n$ $Q_{n+1}$ $Z|\{Q_{n+1}, X\}$

— リッチ
ソース