4
未知のクラスター数と非ユークリッド距離のクラスター化方法について何か提案はありますか?
コンサルティングプロジェクトのクラスタリング(教師なし分類)メソッドについていくつかの提案が必要です。私はうまくいけば次のプロパティを持つメソッドを探しています: 私の研究の主題には3つの特性があります。1つは(非ユークリッド)距離行列で表され、他の2つはユークリッド空間のベクトルの形式です。距離行列はシーケンスに由来し、非類似度の割合またはシーケンスの距離の他の測定値の形式にすることができます。このアルゴリズムは、ユークリッド空間のベクトルと非ユークリッド距離の両方のベクトルを入力として使用できる必要があります。たとえば、K-medoidは距離行列で機能しますが、K-meansは機能しません。 アルゴリズムが3つのプロパティのクラスター数と重みを自動的に選択するようにします(事前の知識と制約付き)。 以前に特定された「クラスターの中心」の情報があります。以前の値または初期値として組み込みたいと思います。 統計学者として、私はこの方法が明確な尤度または損失関数を持つことを望みます。 私が考えることができる最も近いことは、クラスターの数を決定するためにリバースジャンプMCMCを使用してベイジアンフレームワークに混合モデルをあてはめることです。R ^ dのベクトルは、通常の尤度に簡単に定式化できますが、距離行列の処理方法は不明です。MCMCを実行する各観測での通常の尤度の平均を制限できますが、これには明確な数学的/統計的意味がありません。 誰かが同様の問題の経験がありますか?参考文献への提案は高く評価されます!