非対称距離メジャーを使用したクラスタリング


9

非対称距離メジャーを使用してフィーチャをどのようにクラスタリングしますか?

たとえば、曜日を特徴としてデータセットをクラスタリングしているとしましょう。月曜日から金曜日までの距離は金曜日から月曜日までの距離と同じではありません。

これをクラスタリングアルゴリズムの距離測定にどのように組み込みますか?

回答:


3

未来が過去と異なるためにMF距離が非対称である場合、純粋な非対称クラスタリングが必要です。まず、非対称距離関数を定義する必要があります。

距離関数を指定して非対称クラスタリングを行う1つの方法は、元のデータを新しい座標空間に埋め込むことです。チノナオヒトと白岩健一による「非対称MDSのいくつかの非距離モデルの幾何学的構造」、Behaviormetrika、1992(pdf)を参照してください。これは、HCM(エルミート正準モデル)と呼ばれます。

エルミート行列を見つけます。ここで、 固有値と固有ベクトルを見つけ、対応する固有値の平方根で各固有ベクトルをスケーリングします。H

Hij=12[d(xi,xj)+d(xj,xi)]+i12[d(xi,xj)d(xj,xi)]

これにより、データが複素数の空間に変換されます。データが埋め込まれると、オブジェクトxとyの間の距離はx * yになります。ここで*は共役転置です。この時点で、複素数ベクトルに対してk-meansを実行できます。

スペクトル非対称クラスタリングも行われています。ステファンエミロフアテフの論文「軌跡のスペクトルクラスタリングにおける非対称性の使用」、2011年ミネソタ大学、特別なアルゴリズムのMATLABコードを提供する論文を参照してください。


1

ある種の平均をとることができます(算術平均、または確率分布の場合は、ジェンセンシャノン発散の平方根)。



1

距離関数が有効なMercerカーネルでない場合、。ここで、はグラム行列です。この場合、バイクラスタリングとも呼ばれる共クラスタリングが必要です。このクラスのアルゴリズムは、行と列のクラスターインジケーターを同時に生成します。XXTX

あなたが与えた例は、不十分な距離測定基準の結果です。より良い距離の測定基準は、|days apart|

通常、距離関数は有効なMercerカーネルでなければなりません。有効なMercerカーネルは、連続的で対称であり、分散行列を持つ2つの観測値を取る任意の関数です。xD

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.