データセットには73個のサンプルがあり、17個の数値と5個のバイナリ(0-1)変数があります。クラスター分析を実行する必要があります。ガワー距離は、変数が混在するデータセットに適したメトリックであることを知っています。しかし、ガワー距離がバイナリ変数間の差をどのように計算するのか理解できませんでした。ユークリッド距離と変わらないようです。
あなたの質問ははっきりしていません。あなたは単に「ガワー距離はバイナリ変数間の差をどのように計算するのですか」と尋ねていますか?「ユークリッドより違いはない」とはどういう意味ですか?
—
ガン-モニカの回復
ありがとうございました。申し訳ありませんが、Gowerがバイナリ変数間の差をどのように計算するかを尋ねます。つまり、違いを理解することができませんでした。バイナリ変数のユークリッドとガワー。
—
EmrahBilgiç2014年
このサイトを検索しました
—
ttnphns
Gower
か?stats.stackexchange.com/a/15313/3277
はい、そうしました。ユークリッド距離は、両方のサンプルに同じ値がある場合は0、そうでない場合は1です。ガワーはどうですか?
—
EmrahBilgiç2014年
@EmrahBilgiç、Gowerメトリックは類似性であり、距離ではありません。1から引くと「距離」になります。バイナリデータの処理方法については、上記のリンクを参照してください。
—
ttnphns 2014年