3
k-meansクラスター分析後のANOVAの適切性
K平均分析後のANOVAテーブルの後の通知は、距離を最大化するためにクラスター解がユークリッド距離に基づいて導出されているため、有意水準を同等平均のテストと見なすべきではないことを示しています。クラスタリング変数の平均がクラスター間で異なるかどうかを示すために、どのテストを使用する必要がありますか?この警告はk-means出力の提供されたANOVAテーブルで見ましたが、いくつかの参考文献では、事後ANOVAテストが実行されていることがわかります。k-mean ANOVA出力を無視し、事後検定で一元配置ANOVAを実行し、従来の方法で解釈する必要がありますか?または、F値の大きさだけを暗示したり、どの変数が差に寄与したかを示すことはできますか?別の混乱は、クラスタリング変数がANOVAの仮定に違反して正規分布していないことです。Kruskal-Wallisノンパラメトリック検定を使用できますが、同じ分布に関する仮定があります。特定の変数のクラスター間分布は同じように見えず、一部は正に歪んでおり、一部は負になっています... 1275個の大きなサンプル、5つのクラスター、10個のクラスター変数がPCAスコアで測定されています。