回答:
KL発散は、2つの確率分布の差を測定する自然な方法です。エントロピー分布のpがから引き出さ無損失エンコードイベントに(平均して)必要とされるメッセージ当たりのビットの最小可能数与えるPを。この限界を達成するには、p向けに設計された最適なコードを使用する必要があります。これは、短いコードワードをより高い確率のイベントに割り当てます。D K L(P ∥ Q )は、数の期待値として解釈することができる余分の真の分布から引き出さエンコードイベントに必要なメッセージ当たりのビットP、pではなく分布最適なコードを使用する場合。分布を比較するための素晴らしいプロパティがいくつかあります。たとえば、pとqが等しい場合、KL発散は0です。
KLの発散とクロスエントロピーは次のように関連しています。
Kullback-Leibler発散(この場合、加法定数までのクロスエントロピーに等しい)です。
ファン・デル・マーテンとヒントン(2008)。t-SNEを使用したデータの視覚化。