私の希望は、いくつかのクラスタリングアプローチの時間の複雑さについて説明することです。たとえば、次元空間にデータポイントがます。
さらに、次元のペアワイズ非類似度マトリックスが既に計算されており、ステップをすでに費やしていると仮定します。その時の時間の複雑さは何ですか
- ウォードのリンケージを使用した階層的クラスタリング(HC)
- 完全リンケージを使用するHC
- 平均リンケージを使用するHC
- 単一リンケージを使用するHC
- -medoidアプローチ
- 平均法
非類似度行列がまだ計算されていない場合、何か利点はありますか?私はそれがHCのために必要であることを理解してたようkは -medoidアプローチではなく、ために --meansを?
ご協力ありがとうございました!
これはCSの質問であり、統計分析に関する質問ではありません。現在、area51.stackexchange.com / proposals / 5120 /…の提案段階にあるアルゴリズムのSEサイトに完全に適しています。
—
whuber
また、距離行列をエッジ加重グラフに変換し、グラフのクラスタリング手法(van DongenのMarkov CLusteringアルゴリズムまたは私の制限付き近隣検索クラスタリングアルゴリズムなど)を適用することもできますが、これは単純なアルゴリズムの質問よりもORの質問に近いです(グラフのクラスタリングアルゴリズムは一般的に密なグラフには不適切であり、距離行列をグラフに変換する目的に反することを指摘しました)
—
Andrew D. King