なぜKLの発散が負でないのですか?


18

なぜKLの発散は非負ですか?

情報理論の観点から、私はそのような直感的な理解を持っています:

xでラベル付けされた同じ要素セットで構成される2つの集団Bがあるとします。p x およびq x は、それぞれ集団AおよびBの異なる確率分布です。ABxp(x)q(x)AB

情報理論の観点から、は、アンサンブルAの要素xを記録するために必要なビットの最小量です。その結果、期待 Σ X E N S Eのm個のBのL個のE - Plog2(P(x))xA 我々は要素記録する必要があることをどのように多くのビットを少なくともとして解釈することができる Aを平均。

xensemblep(x)ln(p(x))
A

この式は平均的に必要なビットに下限を設定するため、異なる確率分布q x をもたらす異なるアンサンブルに対して、各要素xに与える境界は確実にビット化されません与えられるP X 、その期待値をとる手段、Σ X E N S Eのm個のBのL個のE - P X LN Q X Bq(x)xp(x)

xensemblep(x)ln(q(x))
この平均長さが確実に前者につながるよりも大きくなる
pxqxが異なるため、ここに は≥を入れません。
xensemblep(x)ln(p(x))ln(q(x))>0
p(x)q(x)

これは私の直感的な理解ですが、KLの発散が非負であることを証明する純粋に数学的な方法はありますか?問題は次のように説明できます。

所与及びQ xは実際のライン上の両方陽性であり、+ - P X D 、X = 1+ - Q X D 、X = 1。証明+ p(x)q(x)+p(x)dx=1+q(x)dx=1

+p(x)lnp(x)q(x)

これはどのように証明できますか?または、これは追加の条件なしで証明できますか?


1
Fanoの不等式の証拠を理解すれば、相対エントロピーの非負性を導き出すのは簡単です。
ラーナーチャン

回答:


29

証明1:

lnaa1a>0

DKLp||q0DKLp||q0

Dp||q=バツpバツlnpバツqバツ=バツpバツlnqバツpバツ(a)バツpバツqバツpバツ1=バツqバツバツpバツ=11=0

ln

バツpバツログ2pバツバツpバツログ2qバツ

そして、左の項を右に持ってくると、

バツpバツログ2pバツバツpバツログ2qバツ0バツpバツログ2pバツqバツ0

これを別の証明として含めない理由は、ギブスの不等式を証明するように頼まれた場合、KLの発散の非負性から始めて、上から同じ証明を行う必要があるためです。


証明2:Log sum不等式 を使用します:

i=1nailog2aibi(i=1nai)log2i=1naii=1nbi

Then we can show that DKL(p||q)0:

D(p||q)=xp(x)log2p(x)q(x)(b)(xp(x))log2xp(x)xq(x)=1log211=0

where we have used the Log sum inequality at (b).


Proof 3:

(Taken from the book "Elements of Information Theory" by Thomas M. Cover and Joy A. Thomas)

D(p||q)=xp(x)log2p(x)q(x)=xp(x)log2q(x)p(x)(c)log2xp(x)q(x)p(x)=log21=0

where at (c) we have used Jensen's inequality and the fact that log is a concave function.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.