クラスター分析では、純度をどのように計算しますか?方程式は何ですか?
私は私のためにそれを行うためのコードを探していません。
してみましょうクラスタK、となるC jの BEクラスj。
純度は実質的に正確ですか?サンプルサイズ全体でクラスターごとに真に分類されたクラスの量を合計しているようです。
問題は、出力と入力の関係は何ですか?
Truly Positive(TP)、Truly Negative(TN)、False Positive(FP)、False Negative(FN)がある場合。それである?
3
簡単な定義だけが必要な場合:クラスタリングの純度に関するトップのGoogle検索** は、数学的な定義を提供するリンクです。(**私にとっては、少なくとも-あなたの個々の結果は異なる場合があります)
—
Glen_b -Reinstate Monica 14
「純度」の意味がわかりませんが、David Colquhounは優れた教科書Lectures on Biostatistics(1971)のpp。111-114の二項サンプリングの例として「心臓の純度の黒魔術分析」を使用しています。著者のウェブサイトから無料のPDFとして入手可能:dcscience.netたとえそれがあなたの質問とは無関係であっても、それは素晴らしい話です。
—
マイケルルー-モニカの復元14年
分類ツリーでは、不純物を測定する関数の一部は次のとおりです。再置換エラー、ジニ指数、およびエントロピー。(分類ツリーは特定の形式のクラスタリングを実行するため、これは関連性があると思います。)これが役立つことを願っています!
—
アンジェロフ14