K平均法クラスタリング変換不変条件は何ですか?


8

データポイントのセットX={x1,x2,,xm}が与えられた場合、で K平均を実行し、クラスター。 X C 1C 2... CのKxiRdXc1,c2,,ck

ここで、新しいデータセットを作成するとY={y1,y2,,ym}、およびあり、 K平均を実行してクラスターを取得します。。Y IR D Y G 1G 2··· G Kyi=Axi+byiRdYg1,g2,gk

Abのどの条件下でb、同じクラスターを取得することが保証されますか?

K平均がユークリッド距離を使用しており、両方のアルゴリズムで同じ初期条件を持っていると仮定します。つまり、Xの初期中心が場合、Yの初期中心はここで、です。 g 0 1g 0 k g 0 i = A c 0 i + bc10,,ck0g10,,gk0gi0=Aci0+b

これまでのところ、はフルランクでなければならず、は任意のベクトルにすることができると考えてきました。しかし、それを証明することはできませんでした。Ab

回答:


6

答えはあなたのK-meansアルゴリズムに依存しますが、以下は標準的なアルゴリズムでうまくいくはずです。

変換が2つの条件を満たす場合、同じ結果が得られます。T

  1. d(z,w)=d(T(z),T(w))dd(z,w)=zw
  2. 平均を保持します。が、凸の組み合わせである場合。ipiziT(ipizi)=ipiT(zi)

これを確認するには、アルゴリズムを見直し、常に同じ選択を行うことを示します。


Yuvalに感謝します。これは非常に理にかなっています。これは、ユークリッド距離の場合、Aが厳密な変換を作成するための直交行列でなければならないことを意味しますか?
Ana Echavarria

本当にそうです。
Yuval Filmus
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.