変数に重みを割り当てる1つの方法は、そのスケールを変更することです。このトリックは、あなたが言及したクラスタリングアルゴリズム、つまりvizに対して機能します。k-means、加重平均リンケージおよび平均リンケージ。
カウフマン、レナード、ピーターJ.ルセウ。「データ内のグループの検索:クラスター分析の概要」(2005)-ページ11:
測定単位の選択により、変数の相対的な重みが生じます。変数を小さい単位で表すと、その変数の範囲が大きくなり、結果の構造に大きな影響を与えます。一方、標準化することにより、客観性を達成することを期待して、すべての変数に同じ重みを与える試みが行われます。そのため、事前知識のない開業医が使用する場合があります。ただし、特定のアプリケーションでは一部の変数が他の変数よりも本質的に重要であり、重みの割り当ては主題の知識に基づいている必要がある場合があります(たとえば、Abrahamowicz、1985を参照)。
一方、変数のスケールに依存しないクラスタリング手法を考案する試みがありました(Friedman and Rubin、1967)。Hardy and Rasson(1982)の提案は、クラスターの凸包の総体積を最小化するパーティションを検索することです。原則として、そのような方法はデータの線形変換に関して不変ですが、残念ながらその実装のためのアルゴリズムは存在しません(2次元に制限される近似を除いて)。したがって、標準化のジレンマは現在避けられないように見え、この本で説明されているプログラムはユーザーに選択を任せています
Abrahamowicz、M。(1985)、非類似度を測定するための非数値的なpnon情報の使用、心理測定学会と分類学会の第4回ヨーロッパ会議で発表された論文、7月2-5日、ケンブリッジ(イギリス)。
フリードマン、HP、およびルービン、J。(1967)、データをグループ化するためのいくつかの不変の基準について。J アメール。統計学者。ASSOC6。、2、1159-1178。
Hardy、A.、and Rasson、JP(1982)、Une nouvelle approche des problemes de classification automatique、Statist。肛門。ドニーズ、7、41-56。