2つの多変量ガウス分布間のKL発散


46

2つの多変量正規分布を仮定したKL発散式の導出に問題があります。単変量のケースはかなり簡単にできました。ただし、数学の統計情報を取得してからかなりの時間が経過しているため、多変量のケースに拡張するのに苦労しています。単純なものが欠けているだけだと確信しています。

私が持っているものは...

両方の仮定qは手段で正規分布の確率密度関数であり、μ 1及びμ 2と分散Σ 1及びΣ 2をそれぞれ、。qからpへのカルバック・ライブラー距離は次のとおりです。pqμ1μ2Σ1Σ2qp

の2面の多変量法線のためのものです、[log(p(x))log(q(x))] p(x) dx

12[log|Σ2||Σ1|d+Tr(Σ21Σ1)+(μ2μ1)TΣ21(μ2μ1)]

この証明と同じロジックに従って、行き詰まる前にここまで到達します。

=[d2log|Σ2||Σ1|+12((xμ2)TΣ21(xμ2)(xμ1)TΣ21(xμ1))]×p(x)dx

=E[d2log|Σ2||Σ1|+12((xμ2)TΣ21(xμ2)(xμ1)TΣ21(xμ1))]

トレーストリックを実装する必要があると思いますが、その後はどうすればよいかわかりません。私を正しい道に戻すための役立つヒントをいただければ幸いです!


1
stanford.edu/~jduchi/projects/general_notes.pdf。最後のセクションでは、派生についても説明します。
user3540823

回答:


47

少し修正して始めたところから始めて、

KL=[12log|Σ2||Σ1|12(xμ1)TΣ11(xμ1)+12(xμ2)TΣ21(xμ2)]×p(x)dx=12log|Σ2||Σ1|12tr {E[(xμ1)(xμ1)T] Σ11}+12E[(xμ2)TΣ21(xμ2)]=12log|Σ2||Σ1|12tr {Id}+12(μ1μ2)TΣ21(μ1μ2)+12tr{Σ21Σ1}=12[log|Σ2||Σ1|d+tr{Σ21Σ1}+(μ2μ1)TΣ21(μ2μ1)].

Matrix Cookbookのセクション8.2のプロパティをいくつか使用していることに注意してください。


私が最初に持っていたDを取り出したのを見ます。最初のいくつかのステップでガウスのログを取得した後、D項を取得しませんか?
dmartin

(2π)d/2|Σk|1/2k=1,2(2π)d/2d1/2

全く問題なし。お役に立てて嬉しいです。
-ramhiser

μ1μ2μ2μ1

1
@acidghostどちらかが機能するのは、両側から負の値を除外できるためです。2つの負の値を乗算すると、正の値が得られます。
ramhiser
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.