回答:
単語が与えられたドキュメントのトピックを予測しているとしましょう。
生成モデルは、各トピックの可能性と、そのトピックに単語が与えられる可能性を示します。これは、ドキュメントが実際に世界によって「生成された」と言う方法です。トピックは、ある分布に従って発生し、単語はトピックのために発生します。ドキュメントがあります。単語WのドキュメントをトピックTに分類することは、同時尤度を最大化することです:P(T、W)= P(W | T)P(T)
識別モデルは、トピックに単語が与えられる可能性を説明するだけで機能します。単語やトピック自体がどれほど可能性が高いかについては何も述べられていません。タスクは、P(T | W)を直接モデル化し、これを最大化するTを見つけることです。これらのアプローチは、P(T)またはP(W)を直接気にしません。