なぜガウスカーネルを類似性メトリックとして使用するのですか?


7

グラフベースのクラスタリングで、類似性メトリックとして2点間の距離ではなく、ガウスカーネルを使用することが望ましいのはなぜですか?


1
類似性については、0と1の間にしたいと考えています。ガウスカーネルはこれを満たし、2点間の距離が大きくなると重みが大きくなります。他に理由はありますか?
zfb 2017年

ここで、あなたは非常によく機能を説明したビデオ>見ることができますcoursera.org/lecture/machine-learning/...
ジョザニHosein

回答:


8

正確にしましょう。「距離」はデータサイエンスで多くの意味を持っています。ユークリッド距離についてお話していると思います。

ガウスカーネルは、ユークリッド距離の非線形関数です。

ここに画像の説明を入力してください

  • カーネル関数、距離とともにゼロと1の間の範囲で減少します。ユークリッド距離では、値は距離とともに増加します。したがって、カーネル関数は、観測値の重み付けに役立つメトリックです。

  • ゼロと1の間にあるという事実は良い特性ですが、ユークリッド距離の絶対距離(それは何でもかまいません)は、モデル化を不安定にし、困難にする可能性があります。

  • ユークリッド距離(負の符号なし)は類似性の尺度ではなく、距離関数です。ガウスカーネルは類似性の尺度です。

  • ガウスカーネルは、ユークリッド距離の正規化関数のように考えることができます。


1
また、式のσについても質問があります。意味はありますか?私の意見では、それはクラスタリングのスケール(たとえば、円形クラスタリングの半径)に関連していると思います。
zfb 2017年

@zfbスケーリングパラメータです。分母は定数のように書くことができます。
HelloWorld 2017年

では、このスケーリングパラメータは、K(x、x ')の値または類似性にどのように影響するのでしょうか。それが大きくなると、K(x、x ')が大きくなり、距離が小さくなったと言えますか?そして、この場合、大規模なクラスタリングを調べています(たとえば、クラスタが円で識別されている場合、円の半径は大きくする必要があります。または、いくつかのポイントをまとめて「ポイント」として再定義し、それらの集約されたポイントをクラスタ化します)。
zfb 2017年

0

ユークリッド距離から、カーネル関数(多項式、指数、マターン、カスタム...)から多くの類似性測定値を導き出すことができますが、ガウスカーネルよりもアプリオリに優れたものや悪いものはありません。それはすべてあなたのデータとあなたが期待するものに依存します。

カーネル関数を指定すると、自分の感覚に合う距離の定義を選択することもできます。重み付きユークリッド距離、 L1 規範、 L 規範、アースムーバーの距離...

現在、ユークリッド距離のガウスカーネルは非常に直感的であり、滑らかさなどの有用なプロパティを提供するため、非常に一般的です。


0

軸が表されるユークリッド空間では jkベクトル、3次元空間、距離は、2つの点を接続し、接続の長さを見つけることによって取得できます。この空間は、各方向の基準が独立している場合に使用されます。言い換えると、真の距離を見つける必要があるときはいつでも、フィーチャまたは変数、実際に軸が独立している場合、ユークリッド距離を使用できます。逆に、変数が相関している場合は、軸が独立していないため、ユークリッド距離を使用できません。まれではないこのような状況では、マハラノビスを利用できます。その形はガウス距離のようなものです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.