連続分布のエントロピーの解釈?


7

「エントロピー」は、確率分布の「情報」の程度を大まかに捉えたものです。

離散分布の場合、より正確な解釈があります。離散確率変数のエントロピーは、確率変数の結果を転送するために必要な予想ビット数の下限です。

しかし、連続確率変数の場合、結果の数は無数にあります。そのため、ビットの有限文字列で発生した正確な結果を転送し始めることさえできません。

連続変数のエントロピーの同等の解釈は何ですか?


1
確率分布における「情報の程度」の定義はありますか?
kjetil b halvorsen

@kjetilbhalverson、これでどこへ行くのか分からないの?質問はかなり明確ではありませんか?
user56834

ここここで良い答えが得られると思います
COOLSerdash

@COOLSerdash完璧です。これらの2つにリンクする答えを出していただけませんか。ポイントをお伝えします。
user56834

@ Programmer2134私は本当に感謝していますが、あまりコンテキストがない(ここではお勧めしません)リンクを投稿して、ポイントを獲得するだけでは満足できません。申し訳ありません。
COOLSerdash

回答:


4

離散点の密度制限するため、の解釈

S=xp(x)lnp(x)
に一般化することはできません
S=dx(p(x)lnp(x))

直接一般化は

S=dxp(x)ln(p(x)dx)=dxp(x)ln(p(x))dxp(x)ln(dx)
明らかに lndx 爆発する。

直感的に、 p(x)dx=0そのため、発生する可能性が高いものをエンコードするため使用するビット数を少なくする理由は成り立ちません。したがって、解釈する別の方法を見つける必要がありますS=dxp(x)ln(p(x)dx)、そして選択は KL 発散。

均一な分布があるとしましょう q(x) 同じ状態空間では、

KL(p(x)q(x))=dxp(x)ln(p(x)dxq(x)dx)
以来、、我々は効果の形保つように、単に一定である、同時に構築物で明確に定義された量連続分布。q(x)S=dx(p(x)ln(p(x)dx))p(x)

したがって、ダイバージェンスから、連続分布のエントロピーは次のように解釈できます。KLp(x)

エンコードに均一分布を使用する場合、平均で不要なビット数。p(x)


最後の文は質問のトピックに到達しますが、実際には答えません。ビット数でない場合、この「固有のプロパティ」の解釈は何ですか?
user56834

2
エントロピーはの期待値です。数学の教育の問題なので、人々は通常、あなたがそうするように定義を書き、最初にを書き、次にマイナス記号を積分の外に置くことを好みますが、あなたの答えはその修正を必要とします。。ln(1/P)lnP
Nick Cox

@ニックコックスこれを指摘してくれてありがとう、私はそれを編集しました。
meTchaikovsky

@ Programmer2134私は自分の回答を編集しました。問題がより適切に処理されることを願っています。
meTchaikovsky

@ Programmer2134あなたの質問のおかげで、私はの解釈を完全に誤解していることがわかりました。私は私の答えを修正しました。p(x)lnp(x)
meTchaikovsky

2

確率密度によって問題を離散化します。連続確率変数は密度を持ち、これは局所的におそらくに近似し。これは離散ケースの類似物です。 。そして、微積分理論により、あなたの合計はあなたの状態空間上の積分になります。f(x)P(X[x,x+δx])f(x)δx


1
私は何かが足りないかもしれませんが、私の質問は解釈についてでした。積分は合計の限界であることを知っています。
user56834

1
これは非常に楽観的な答えです!私はもっ​​ともっと複雑だと思います
kjetil b halvorsen

@kjetilbhalvorsen:ええ、ここには多くの詳細情報が記載されています。OPの利点については、このセクション2.3.1を参照してください。crmarsh.com
Alex R.

1
この答えを詳しく説明してもらえますか?小さなビンで分布を離散化することにより、連続エントロピーを近似できることが示唆されているようです。しかし、あなたのリンクはこれが機能しないことを示しており、「連続エントロピーの公式は何の派生物でもない」とさえ言っています
ジョニー・ローモンド'30年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.