クラスタ内の平方和が最小になるように、ポイントのセットを2つの等しいサイズのサブセットに分割したいと思います。ポイントは2次元のユークリッド空間にあると想定できます。k = d = 2の場合、一般的なk平均クラスタリングアルゴリズムよりも高速なものを期待しています。誰かがこのための良いアルゴリズムの方向に私を向けることができますか?
適切な近似があれば、正確な解は必要ありません。
ありがとう!
クラスタ内の平方和が最小になるように、ポイントのセットを2つの等しいサイズのサブセットに分割したいと思います。ポイントは2次元のユークリッド空間にあると想定できます。k = d = 2の場合、一般的なk平均クラスタリングアルゴリズムよりも高速なものを期待しています。誰かがこのための良いアルゴリズムの方向に私を向けることができますか?
適切な近似があれば、正確な解は必要ありません。
ありがとう!
回答:
正確なパーティションを主張する場合は、平面内の一連のポイントのすべてのバランスのとれたパーティションを直線で計算する必要があります(最適なパーティションはボロノイパーティションなので、2つのポイントセットは直線で区切られます)。このようなパーティションはセットと呼ばれます。最速で現在、この仕事のために知られているアルゴリズムO (N 4 / 3ログN )デュアル[すなわち、これらのパーティションを計算するためのk個のセットのレベルのn個の行、K = N / 2]。可能なすべてのパーティションを取得したら、各パーティションをチェックするだけです。標準的なトリックを使用して、これは各パーティションに対して一定の時間で実行できます。