クラスター分析の結果を検証するために、統計的有意性検定(SST)の使用を調査しています。このトピックに関するいくつかの論文を見つけました。
- 「高次元、低サンプルサイズデータのクラスタリングの統計的重要性」、Liu、Yufeng et al。(2008)
- 「クラスター分析におけるいくつかの有意性検定について」、Bock(1985)
しかし、クラスター分析の結果を検証するのにSSTは適切でないと主張する文献を見つけることに興味があります。私がこれを主張している唯一のソースは、ソフトウェアベンダーのウェブページです
明確にするために:
クラスター分析の結果、重要なクラスター構造が見つかったかどうかをテストすることに興味があるので、「探索的データの結果の事後テストの可能性に関する懸念を支持または反論する論文を知りたい」クラスタを見つけるために使用される分析」。
たとえば、Milligan and Hirtleによる2003年の「クラスタリングと分類方法」という論文を見つけました。たとえば、データにはグループへのランダムな割り当てがないため、ANOVAの使用は無効な分析になります。