合計ssとss間の意味は、k平均クラスタリングで何を意味しますか?


10

クラスター分析は初めてです。私はk-meansクラスタリングにRを使用していますが、それらは何なのでしょうか。そして、それらの比率が小さいか大きい場合はどうすればよいですか?

回答:


12

これは基本的に、k-meansが見つけた分類の良さの尺度です。SSは、Sum of Squaresの略であるため、逸脱度「Between」と逸脱度「Within」の逸脱度の通常の分解です。理想的には、内部凝集と外部分離の特性を持つクラスタリングが必要です。つまり、BSS / TSS比は1に近づく必要があります。

たとえば、Rの場合:

data(iris)
km <- kmeans(iris[,1:4], 3)

88.4%(0.884)のBSS / TSS比を示し、適切なフィットを示します。この数は事前に指定する必要があるため、クラスタの数に対してWSSをプロットすることは、通常、慎重に行う必要があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.