バタチャリャ距離とKL発散の違い


33

次の質問に対する直感的な説明を探しています。

統計と情報理論では、2つの離散確率分布の差の尺度として、バタチャリャ距離とKL発散の違いは何ですか?

それらはまったく関係がなく、まったく異なる方法で2つの確率分布間の距離を測定しますか?

回答:


36

バタチャリヤ係数は、のように定義されるとの距離に変えることができるのD HP Q としてのD HP Q = { 1 - D BP Q } 1 / 2と呼ばれるヘリンガー距離。この間の接続ヘリンガー距離カルバック・ライブラー情報量である D のK LP Q 2

DBpq=pバツqバツdバツ
dHpq
dHpq={1DBpq}1/2
dKLpq2dH2pq=2{1DBpq}

ただし、これは問題ではありません。Bhattacharyya距離d Bp q def =log D Bp q として定義されている場合その後、 D BP Q = - ログD BP Q

dBpq=defログDBpq
dBpq=ログDBpq=ログpバツqバツdバツ=defログhバツdバツ=ログhバツpバツpバツdバツログ{hバツpバツ}pバツdバツ=12ログ{h2バツp2バツ}pバツdバツ=12ログ{qバツpバツ}pバツdバツ=12dKLpq
したがって、2つの距離の不等式は
dKLpq2dBpq
この不等式が最初の不等式から生じるのではないかと思うかもしれません。反対のことが起こります:
logバツ1バツ0バツ1
ここに画像の説明を入力してください

完全な注文があります

dKLpq2dBpq2dHpq2

2
Brilliant! This explanation should be the one I am looking for eagerly. Just one last question: in what case (or what kinds of P and Q) will the inequality becomes equality?
JewelSue

1
Given that the log() function is strictly convex, I would assume the only case for equality is when the ratio pバツ/qバツ で一定です バツ
西安14

5
そして唯一の場合 pバツ/qバツ で一定です バツ いつ p=q
西安

8

両者の間に明確な関係はありませんが、私が見つけられるものを見るためにそれらを簡単に突くことにしました。したがって、これはあまり答えではありませんが、興味深い点です。

簡単にするために、離散分布を操作しましょう。BC距離は次のように記述できます。

d紀元前pq=lnバツpバツqバツ12

KLの発散

dKLpq=バツpバツlnpバツqバツ

これで、ログを合計内にプッシュすることはできません 紀元前 距離なので、ログを外側に引っ張ってみましょう KL 発散:

dKLpq=lnバツqバツpバツpバツ

次の場合の動作を考えてみましょう p 上の均一分布になるように固定されています n 可能性:

dKLpq=lnnlnバツqバツ1nd紀元前pq=ln1nlnバツqバツ

左側には、幾何平均と形式が似ている何かのログがあります。右側には、算術平均の対数に似たものがあります。私が言ったように、これはあまり答えではありませんが、BCの距離とKLの発散が、p そして q

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.