3
「クロスエントロピー」の定義と起源
ソースを引用せずに、ウィキペディアは離散分布とQのクロスエントロピーを次のように定義します。PPPQQQ H×(P;Q)=−∑xp(x)logq(x).H×(P;Q)=−∑xp(x)logq(x).\begin{align} \mathrm{H}^{\times}(P; Q) &= -\sum_x p(x)\, \log q(x). \end{align} この数量の使用を開始したのは誰ですか?そして、この用語を発明したのは誰ですか?私が見た: JE ShoreおよびRW Johnson、「最大エントロピーの原理と最小クロスエントロピーの原理の公理的導出」、情報理論、IEEE Transactions on、vol。26、いいえ。1、pp。26-37、1980年1月。 私は彼らの紹介に従いました A. Wehrl、「エントロピーの一般的な特性」、Modern Physics、vol。50、いいえ。2、pp。221-260、1978年4月。 誰もこの用語を使用しません。 どちらもしない S.カルバックとR.ライブラー、「情報と十分性について」、The Annals of Mathematical Statistics、vol。22、いいえ。1、pp。79-86、1951。 私は見た TM CoverおよびJA Thomas、情報理論の要素(電気通信および信号処理のWileyシリーズ)。Wiley-Interscience、2006年。 そして I.グッド、「仮説の定式化、特に多次元分割表の最大エントロピー」、The Annals of Mathematical Statistics、vol。34、いいえ。3、pp。911-934、1963。 しかし、どちらの論文も、クロスエントロピーをKL発散と同義であると定義しています。 元の紙 CEシャノン、「コミュニケーションの数学理論」、ベルシステム技術ジャーナル、vol。27、1948。 クロスエントロピーについては言及していません(また、「相対エントロピー」の奇妙な定義があります:「ソースのエントロピーと、同じシンボルに制限されている場合の最大値との比」)。 最後に、私はTribusの古い本や論文をいくつか見ました。 上記の方程式が何と呼ばれているのか、誰がそれを発明したのか、またはそれについて素晴らしいプレゼンテーションを持っているのか誰もが知っていますか?