文献で時々見られるように、k-meansのようなクラスタリングアルゴリズムの結果に対して判別分析(DA)を使用する根拠は(もしあれば)何ですか(本質的には精神障害の臨床的サブタイピングについて)。
クラス間の(クラス内の)慣性の最大化(または最小化)をサポートするため、クラスターの構築中に使用された変数のグループの違いをテストすることは一般に推奨されません。したがって、より低い次元の階乗空間に個人を埋め込み、そのようなパーティションの「一般化可能性」のアイデアを得ようとしない限り、私は予測的DAの付加価値を完全に理解することはできません。ただし、この場合でも、クラスター分析は基本的に探索ツールであるため、この方法で計算されたクラスメンバーシップを使用してスコアリングルールをさらに導出することは、一見奇妙に思えます。
推奨事項、アイデア、または関連論文へのポインタはありますか?
R
ます。cran.r