ガワー距離はどのようにバイナリ変数間の差を計算しますか?


12

データセットには73個のサンプルがあり、17個の数値と5個のバイナリ(0-1)変数があります。クラスター分析を実行する必要があります。ガワー距離は、変数が混在するデータセットに適したメトリックであることを知っています。しかし、ガワー距離がバイナリ変数間の差をどのように計算するのか理解できませんでした。ユークリッド距離と変わらないようです。


あなたの質問ははっきりしていません。あなたは単に「ガワー距離はバイナリ変数間の差をどのように計算するのですか」と尋ねていますか?「ユークリッドより違いはない」とはどういう意味ですか?
ガン-モニカの回復

1
ありがとうございました。申し訳ありませんが、Gowerがバイナリ変数間の差をどのように計算するかを尋ねます。つまり、違いを理解することができませんでした。バイナリ変数のユークリッドとガワー。
EmrahBilgiç2014年

このサイトを検索しましたGowerか?stats.stackexchange.com/a/15313/3277
ttnphns

はい、そうしました。ユークリッド距離は、両方のサンプルに同じ値がある場合は0、そうでない場合は1です。ガワーはどうですか?
EmrahBilgiç2014年

4
@EmrahBilgiç、Gowerメトリックは類似性であり、距離ではありません。1から引くと「距離」になります。バイナリデータの処理方法については、上記のリンクを参照してください。
ttnphns 2014年

回答:


5

「男性」と「女性」の値が「m」と「f」のバイナリ属性はどうですか?

二項変数場合、取得できるのは「同じ」または「異なる」だけであることを理解していますか?値が1または0の場合、距離間の重要な違いは違いません。しかし、複数の変数がどのように組み合わされるか。


2

ガワー距離は、連続データポイント間の距離を計算するためにマンハッタンを使用し、カテゴリーデータポイント間の距離を計算するためにダイスを使用します

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.