タグ付けされた質問 「ward」

3
Wardの基準でない場合、hclust()のward.Dはどのアルゴリズムを実装しますか?
オプション "ward.D"(Rバージョン<= 3.0.3の唯一のWardオプション "ward"と同等)で使用されるものは、Ward(1963)クラスタリング基準を実装しませんが、オプション "ward.D2"はその基準( Murtagh and Legendre 2014)。 (http://stat.ethz.ch/R-manual/R-patched/library/stats/html/hclust.html) どうやらward.DはWardの基準を適切に実装していないようです。それにもかかわらず、それが生成するクラスタリングに関しては良い仕事をしているようです。ワードの基準でない場合、method = "ward.D"は何を実装しますか? 参照資料 Murtagh、F.、およびLegendre、P.(2014)。Wardの階層的凝集クラスタリング手法:どのアルゴリズムがWardの基準を実装していますか?Journal of Classification、31(3)、274-295。
16 r  clustering  ward 

3
階層的クラスタリングでマンハッタン距離をワードのクラスター間リンケージで使用しても大丈夫ですか?
階層的クラスタリングを使用して、時系列データを分析しています。私のコードはMathematica関数を使用して実装さDirectAgglomerate[...]れ、次の入力が与えられると階層クラスターを生成します: 距離行列D クラスタ間リンケージを決定するために使用されるメソッドの名前。 マンハッタン距離を使用して距離行列Dを計算しました: d(x,y)=∑i|xi−yi|d(x,y)=∑i|xi−yi|d(x,y) = \sum_i|x_i - y_i| ここで、およびは、時系列のデータポイントの数です。i=1,⋯,ni=1,⋯,ni = 1,\cdots, nn≈150n≈150n \approx 150 私の質問は、ウォードのクラスター間リンケージをマンハッタン距離行列で使用しても大丈夫ですか?一部の情報源は、ウォードのリンケージはユークリッド距離でのみ使用されるべきだと示唆しています。 DirectAgglomerate[...]元の観測値ではなく、距離行列のみを使用してウォードのリンケージを計算することに注意してください。残念ながら、Mathematicaが Wardの元のアルゴリズムをどのように変更するかわかりません。これは、クラスター平均に関して計算された観測値の誤差の平方和を最小化することで機能しました。たとえば、単変量観測のベクトルで構成されるクラスターccc場合、Wardは誤差の平方和を次のように定式化しました。 (∑j||cj−mean(c)||2)2(∑j||cj−mean(c)||2)2(\sum_j||c_j - mean(c)||_2)^2 (MatlabやRなどの他のソフトウェアツールも、距離行列のみを使用してWardのクラスタリングを実装しているため、問題はMathematicaに固有のものではありません。)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.