一連の2次元ポイントが与えられますおよび整数K。最大の円の半径ができるだけ小さくなるように、すべてのnポイントを囲むk個の円のコレクションを見つける必要があります。換言すれば、我々は、設定された見つけなければならないC = { C 1、C 2、... 、CのK }のk個のそのようなコスト関数その中心点コスト(C )= maxのI 分jは Dを(は最小化されます。ここで、 Dは入力点 p iと中心点 c jの間のユークリッド距離を示します。各ポイントは、頂点を k個の異なるクラスターにグループ化する最も近いクラスター中心に割り当てられます。
この問題は(離散)クラスタリング問題として知られ、NPハードです。NP完全な集合集合問題からの縮約により、ρ < 2の問題に対するρ近似アルゴリズムが存在する場合、P = NPであることが示されます。
最適な近似アルゴリズムは非常にシンプルで直感的です。一つの第一のピック点P ∈ P任意セットを入れ、それをCクラスタ中心の。次に、他のすべてのクラスターセンターから可能な限り離れた次のクラスターセンターを選択します。だから| C | < K、我々が繰り返しポイントを見つけるJ ∈ P距離いるD (J 、Cは)最大化に追加されるCを。一度| C | = k完了です。
最適な欲張りアルゴリズムが時間で実行されることを確認するのは難しくありません。これは疑問を提起します:o (n k )時間を達成できますか?どれだけ改善できるでしょうか?