Jeffries Matusitaの距離の長所


11

私が読んでいるいくつかの論文によると、ジェフリーズとマツシタの距離が一般的に使用されています。しかし、私は以下の式を除いてそれについて多くの情報を見つけることができませんでした

JMD(X、Y)= (xi2yi2)22

平方根以外はユークリッド距離に似ています

E(X、Y)= (xiyi)22

分類の点では、JM距離はユークリッド距離よりも信頼性が高いとされています。なぜこの違いがJM距離を改善するのか、誰か説明できますか?


1
xiyi


@ user603はい、私はあなたがそれを持っていると思います。これで、KLの分岐とバタチャリヤ対策への接続が明らかになります。
whuber

回答:


14

以下のより長い説明の前に、いくつかの重要な違いがあります。

  1. 重要なことに、ジェフリーズ-マツシタ距離は、一般的なベクトルではなく、分布に適用されます。
  2. 上記で引用したJM距離式は、離散確率分布を表すベクトル(つまり、合計が1になるベクトル)にのみ適用されます。
  3. ユークリッド距離とは異なり、JM距離は、バッタチャリヤ距離を定式化できる任意の分布に一般化できます。
  4. JM距離は、バッタチャリヤ距離を介して、確率論的解釈を持っています。

bp,q[0,inf)[0,2]

JMp,q=2(1exp(b(p,q))

この論文によると、JM距離の実際的な利点は、この測定は「低い分離度の値を強調しすぎる一方で、高い分離度の値を抑制する傾向がある」ことです。

Bhattacharrya距離は、次の抽象的な連続的な意味で2つの分布との非類似性を測定します: 分布とは、単位長ベクトル(番目の要素はビンの 番目の正規化されたカウント)で表されるヒストグラムによって取得されます。これは、 したがって、2つのヒストグラムのJM距離は次のようにます: これは、正規化されたヒストグラムの場合に注意してくださいpq

b(p,q)=lnp(x)q(x)dx
pqiiN
b(p,q)=lni=1Npiqi
JMp,q=2(1i=1Npiqi)
ipi=1、上記で指定した式と同じです:
JMp,q=i=1N(piqi)2=i=1N(pi2piqi+qi)=2(1i=1Npiqi)

+1ジャンプして状況を明確にするために非常によく行われた努力をしてくれてありがとう。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.