2変量正規分布のJensen-Shannon発散


8

2つの二変量正規分布とられた場合、それらの間のJensen-Shannon発散を計算しようとしています、として次のように定義されます( ここでKLDはカルバックライブラーダイバージェンスです) 、およびM = \ frac {1} {2}(P + Q)分布のパラメーター、したがってJSDに関してKLD を計算する方法を見つけました。 J S D P Q = 1PN(μp,Σp)QN(μq,Σq)JSD(PQ)=12(KLD(PM)+KLD(QM))KLDM=12(P+Q)
KLDJSD

私の疑問は:

  1. Mを計算するにMは、MN(12(μp+μq),12(Σp+Σq))。これは正しいですか?

  2. [ 1 ]でJSDが制限されていることを読みましたが、正規分布について上記で説明したように計算すると、そのようには見えません。それは私がそれを間違って計算している、仮定に違反している、または私が理解できない何かを意味しているのですか?

回答:


8

中点メジャーは、2つの多変量正規分布混合分布であるため、指定した形式ではありません元の投稿で。ましょうの確率密度関数であるランダムベクトルとのPDFである。次に、中点メジャーのpdfは φ PXNμ PΣ Pφ QXNμ QΣ Qφ MX= 1Mφp(x)N(μp,Σp)φq(x)N(μq,Σq)

φm(x)=12φp(x)+12φq(x).

ジェンセンシャノンの相違は、 ここで、はメジャー対応する(微分)エントロピーを示します。h P P

JSD=12(KL(PM)+KL(QM))=h(M)12(h(P)+h(Q)),
h(P)P

したがって、計算は微分エントロピーを計算することになります。多変量正規場合、答えはことがよく知られています と証明は、Cover and Thomas(1991)pp。230-231など、いくつものソースで見つけることができます。上記の式が示すように、多変量正規のエントロピーは平均に関して不変であることを指摘する価値があります。ただし、これはほぼ確実に法線の混合の場合に引き継がれません。(ゼロを中心とした1つの広い法線と、原点から離れたところにある別の集中法線を選択することを考えてください。)1N(μ,Σ)

12log2((2πe)n|Σ|)

中点の測定では、物事はより複雑に見えます。私が知っていることですが、微分エントロピーの閉形式の式はありません。Googleで検索すると、いくつかの潜在的なヒットが得られますが、一般的なケースでは、上位のヒットは閉じたフォームを提供していないようです。なんらかの方法でこの量を概算することに行き詰まっている場合があります。h(M)

また、あなたが参照する論文は、取り扱いを離散分布のみに限定するものではないことにも注意してください。彼らはあなたの問題が彼らの枠組みの中に入るのに十分一般的なケースを扱います。1859ページの2列目の中央を参照してください。ここにも、発散が制限されていることが示されています。これは、2つの一般測度の場合に当てはまり、2つの離散分布の場合に限定されません。

Jensen-Shannon Divergenceがこのサイトの他の質問で最近数回出てきました。こちらこちらをご覧ください。


補遺:法線の混合は、法線の線形結合と同じではないことに注意してください。これを確認する最も簡単な方法は、1次元の場合を考えることです。みようと、それらがであるものとする独立互いに。次に、重みを使用した2つの法線の混合は、分布 X 2Nμ 1 α 1 - α α 0 1 φ MX = α 1X1N(μ,1)X2N(μ,1)(α,1α)α(0,1)

φm(x)=α12πe(x+μ)22+(1α)12πe(xμ)22.

分布線形結合のおよび前と同じ重みを用いて、ビア、ある安定した正規分布の特性である 。X 2 φのX = 1X1X2σ 2 = α 2 + 1 - α 2

φ(x)=12πσ2e(x(12α)μ)22σ2,
σ2=α2+(1α)2

これらの2つの分布は非常に異なりますが、平均は同じです。これは偶然ではなく、期待の直線性から来ています。

混合分布を理解するには、統計コンサルタントに依頼して、彼女がこの分布から値を生成できるようにするとします。彼女は1 つの手のひらで実現を1つ、もう1つの手のひらで実現を1つ保持しています(ただし、2つの手のひらのどちらが入っているかはわかりません)。今、彼女のアシスタントはバイアスされたコインを確率であなたの視界から外し、結果を統計家の耳にささやきます。彼女は手のひらの1つを開き、実現を示しますが、コイン投げの結果はわかりません。このプロセスにより、混合分布が生成されます。X 2 αX1X2α

一方、線形結合は同じコンテキストで理解できます。統計コンサルタントは単に両方の実現を受け取り、最初のと2番目の乗算し、結果を合計して表示します。1 - α α(1α)


ご回答有難うございます。だから、私の問題は(私が計算した)中点分布にあります。私が明白な質問をしている場合、私の無知を許してください。しかし、中点分布は、正規分布確率変数の合計とどう違うのですか?私たちが二変量のケースにいるからですか?
ジョルジュ

2
@jorges合計は正常であるため、単一モードについて対称です。2つの平均が(それらのSDと比較して)十分に離れている場合、混合分布は二峰性です。縮退したケース(平均値とSDが等しい)を除いて、混合は正常ではありません。これは、の式からも明らか。この指数の平均は、2次形式の指数として書き込むことはできません。φm
whuber

@whuber and cardinal:直感的に私はあなたの言うことを理解していますが、コンセプトに関して深刻な問題を抱えているようです。私は実際には統計学者ではなく、「確率変数の合計」と「混合分布」を混合していると思います。私はどの枢機卿とあなたが答えたのかについては本当に争っていませんが、どこかで違いとそれをいつ使うべきかを理解しようとしています。私はいくつかの読書をするために戻って、私が自分を片付けることができるかどうかを確認します。ご回答ありがとうございます。
ホルジュ

2

枢機卿の答えは正しいです。あなたは、2つのガウス分布のジェンセンシャノン分岐の閉じた形の解を得ようとしています。そのような解決策はありません。

ただし、モンテカルロサンプリングを使用すると、ジェンセンシャノンを任意の精度で計算できます。必要なのは、を計算する方法であり、拡張によってです。カルバックライブラーダイバージェンスは次のように定義されます。KLD(P|M)KLD(Q|M)

KLD(P|M)=P(x)log(P(x)M(x))dx

これのモンテカルロ近似は次のとおりです。

KLDapprox(P|M)=1ninlog(P(xi)M(xi))

ここで、はからサンプリングされています。これは、ガウス分布なので簡単です。、。はとして計算できます。xiP(x)nKLDapprox(P|M)KLD(P|M)M(xi)M(xi)=12P(xi)+12Q(xi)


こんにちは@FrankD-私はここにあなたの提案を実装してみました:stats.stackexchange.com/questions/345915/…私はそれがあなたの意図したものとはまったく思っていません。ポインタは大歓迎です。
アストリッド
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.