2つの単変量ガウス分布間のKL発散


79

2つのガウス分布間のKL発散を決定する必要があります。結果をこれらと比較していますが、結果を再現できません。KL(p、p)のKLは0ではないため、私の結果は明らかに間違っています。

私はどこで間違いをしているのだろうか、誰かがそれを見つけられるかどうか尋ねます。

ましょう及び。ビショップのPRMLから、私はそれを知っていますp(x)=N(μ1,σ1)q(x)=N(μ2,σ2)

KL(p,q)=p(x)logq(x)dx+p(x)logp(x)dx

すべての実際の回線で統合が行われ、

p(x)logp(x)dx=12(1+log2πσ12),

私はして自分自身を制限する私として書き出すことができ、p(x)logq(x)dx

p(x)log1(2πσ22)(1/2)e(xμ2)22σ22dx,

に分けることができます

12log(2πσ22)p(x)loge(xμ2)22σ22dx.

取得したログを取得する

12log(2πσ22)p(x)((xμ2)22σ22)dx,

ここで、合計を分離し、積分からを取得します。σ22

12log(2πσ22)+p(x)x2dxp(x)2xμ2dx+p(x)μ22dx2σ22

まかせ下の期待演算子を表し、私はこれを書き換えることができますp

12log(2πσ22)+x22xμ2+μ222σ22.

ことを知っています。副<文>この[前述の事実の]結果として、それ故に、従って、だから◆【同】consequently; therefore <文>このような方法で、このようにして、こんなふうに、上に述べたように◆【同】in this manner <文>そのような程度まで<文> AひいてはB◆【用法】A and thus B <文>例えば◆【同】for example; as an examplevar(x)=x2x2

x2=σ12+μ12

したがって

12log(2πσ2)+σ12+μ122μ1μ2+μ222σ22,

として置くことができます

12log(2πσ22)+σ12+(μ1μ2)22σ22.

すべてをまとめると、

KL(p,q)=p(x)logq(x)dx+p(x)logp(x)dx=12log(2πσ22)+σ12+(μ1μ2)22σ2212(1+log2πσ12)=logσ2σ1+σ12+(μ1μ2)22σ22.
2つの同一のガウス分布に対して に等しいため、これは間違っています。1

誰でも私のエラーを見つけることができますか?

更新

mpiktasが問題を解決してくれてありがとう。正解は次のとおりです。

KL(p,q)=logσ2σ1+σ12+(μ1μ2)22σ2212


そもそも間違った答えを投稿してすみません。私はちょうど見てとすぐに、積分がゼロであることを考えました。それが二乗された点は完全に私の心を逃しました:)xμ1
mpiktas

多変量の場合はどうですか?

研究論文で、kldは$ KL(p、q)=½*((μ₁-μ₂)²+σ₁²+σ₂²)*((1 /σ₁²)+(1 /σ²²))-2
skyde

1
私はあなたの質問にタイプミスがあると思う、私はそれを検証することができず、あなたの質問で後で正しいバージョンを使用したようだ:マイナス(マイナスに注意):私はあなたの質問を編集しようとしましたが、それを禁止されたので、おそらく自分でそれをしてください。
p(x)logp(x)dx=12(1+log2πσ12)
p(x)logp(x)dx=12(1+log2πσ12)
y-spreen

その答えは、1996年の本質的な損失に関する論文にもあります。
西安

回答:


59

わかった、悪い。エラーは最後の式にあります。

KL(p,q)=p(x)logq(x)dx+p(x)logp(x)dx=12log(2πσ22)+σ12+(μ1μ2)22σ2212(1+log2πσ12)=logσ2σ1+σ12+(μ1μ2)22σ2212

欠落している注意してください。および場合、最後の行はゼロになります。 μ1=μ12μ1=μ2σ1=σ2


@mpiktas私は本当に質問を意味しました-bayerjは著名な研究者であり、私は学部生です。賢い人でさえ時々インターネットで尋ねることに戻ることを見るのは素晴らしいことです:)
N. McA。

3
pまたはμ1σ1μ2σ2
コング

質問で述べたように、@ Kong pはです。N(u1,σ1)
zplizzi

31

私はあなたの計算を見ていませんでしたが、ここに私の詳細がたくさんあります。仮定平均の正規確率変数の密度で、分散、及びその平均値で、通常の確率変数の密度で、分散。からまでのカルバック・ライブラー距離は次のとおりです。pμ1σ12qμ2σ22qp

[log(p(x))log(q(x))]p(x)dx

=[12log(2π)log(σ1)12(xμ1σ1)2+12log(2π)+log(σ2)+12(xμ2σ2)2] ×12πσ1exp[12(xμ1σ1)2]dx

={log(σ2σ1)+12[(xμ2σ2)2(xμ1σ1)2]} ×12πσ1exp[12(xμ1σ1)2]dx

=E1{log(σ2σ1)+12[(xμ2σ2)2(xμ1σ1)2]}

=log(σ2σ1)+12σ22E1{(Xμ2)2}12σ12E1{(Xμ1)2}

=log(σ2σ1)+12σ22E1{(Xμ2)2}12

()(Xμ2)2=(Xμ1+μ1μ2)2=(Xμ1)2+2(Xμ1)(μ1μ2)+(μ1μ2)2

=log(σ2σ1)+12σ22[E1{(Xμ1)2}+2(μ1μ2)E1{Xμ1}+(μ1μ2)2]12

=log(σ2σ1)+σ12+(μ1μ2)22σ2212

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.