ヘリンジャー距離とは何ですか?


19

Hellinger Distanceで実際に何が起こるかを知りたい(簡単に言えば)。さらに、私はHellinger Distanceを使用できる問題の種類を知ることに興味がありますか?Hellinger Distanceを使用する利点は何ですか?


9
Hellinger距離は、ユークリッド距離の確率的類似物です。顕著な特性は、メトリックとしての対称性です。このような数学的特性は、論文を書いているときに、証明を可能にするために特定の特性を持つ距離関数が必要な場合に役立ちます。アプリケーションでは、あるタスクについて、あるメトリックが別のメトリックよりも優れた、または優れた結果を生成することを発見する場合があります。例えば、ワッサースタインの距離は、内のすべての怒りで生成的な敵対ネットワーク
エムレ

コメントありがとうございます。私はこの質問に出くわしましたが、これは現在の質問と非常によく似ています。datascience.stackexchange.com/questions/22324/…Hellinger Distanceが適していると答える理由を教えてください。
スミスヴォルカ

2
おそらく、メトリック空間でトピックを視覚化するために。もう1つの優れた特性は、サポートが異なる分布のHellinger距離が有限であることです。これらの質問をしているのは良いことです。さまざまなメトリックを自分で試して結果を観察することをお勧めします。
エムール

ありがとう。その良いリンク。大いに役立ちます。しかし、リンクに記載されているように、ヘリンジャーの距離は、潜在ディリクレ配分(LDA)から派生したトピックのみに制限されていますか?
スミスヴォルカ

1
いいえ、LDAとの固有の接続はありません。
エムール

回答:


7

ヘリンジャー距離は、2つの確率分布の差を測定するメトリックです。これは、ユークリッド距離の確率的類似物です。

PQ

h(P,Q)=12PQ2

2つの確率分布の差を定量化するときに役立ちます。たとえば、サービスのユーザーと非ユーザーの分布を推定する場合。一部のフィーチャのそれらのグループ間のHellinger距離が小さい場合、それらのフィーチャはセグメンテーションに統計的に有用ではありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.