回答:
1つの方法は、カルバックライブラーダイバージェンスのプロパティを使用することです。
ましょう所定のマージンを持つ分布のファミリーであり、およびlet生成物の分布である(明らかと)。
ここで、任意のについて、クロスエントロピーは次のようになります。
つまり、マージンのクロスエントロピーの合計です。マージンはすべて固定されているため、この用語自体も固定する必要があります。
これで、KLダイバージェンスを次のように書くことができます。
それゆえ:
つまり、エントロピーを最大化する分布は、でKL発散を最小化する分布であり、KL発散の特性により、自体であることがわかります。