重み付きユークリッド距離を使用する場合と、使用する重みを決定する方法は?


16

各データがn異なるメジャーで構成されるデータのセットがあります。各メジャーについて、ベンチマーク値があります。各データがベンチマーク値にどれだけ近いかを知りたい。

次のように加重ユークリッド距離を使用することを考えました:

dバツb==1nwバツb21/2

どこ

バツは、特定のデータのi番目のメジャーの値です

bは、そのメジャーに対応するベンチマーク値です。

wは、次の条件に従って、i番目のメジャーにアタッチする間の重みの値です。

0<w<1および=1n1

しかし、このドキュメントに基づいて、使用する重みはi番目のメジャーの分散の逆数であることがわかりました。このような重み付けは、各メジャーに付加する重要性を説明するとは思わない。

したがって:

  1. 観測者のメジャーの相対的な重要性を反映する重みのセットを思いつく方法はありますか、または観測者は重みに任意の値を割り当てることができますか?

  2. この問題を解決するには、重み付きユークリッド距離を使用するのが適切ですか?

回答:


16

標準化の重み

w

重要性の重み

「重要度」の測定値など、好きなものを自由に配置できます(ただし、測定単位が異なる場合は、重要度の重み付けの前に標準化することもできます)。

バツbwbある次元の現状の位置である可能性があり、そこからさまざまな俳優の位置が異なります。このアプリケーションでは、顕著性と位置の両方を主張するよりも測定することを確かに好むでしょう。いずれにせよ、重要度の高い問題は、アクターが最初の方程式に従って計算された場合、アクター間の全体的な距離への影響があまり顕著ではないという違いをもたらします。また、このバージョンでは、ポジション間に関連する共分散がないことを暗黙的に仮定していることに注意してください。これはかなり強力な主張です。

ここで質問2に焦点を当てます:アプリケーションで、推移的な選好構造などに関するゲームの理論的仮定の重みと距離の根拠の正当性を説明しました。最終的に、これらがこの方法で距離を計算することが「適切」である唯一の理由です。それらがなければ、三角形の不等式に従う数字の束があります。

暗黙的な測定としての重み

共分散のテーマでは、あなたが持っている測定の多くが実際に類似したものを測定していると仮定して、距離が実質的に意味のある関連部分空間を識別するものとして問題を考えると役立つかもしれません。要因分析などの測定モデルは、距離を計算できる共通の空間に重み付きの組み合わせを介してすべてを投影します。しかし、再び、それが理にかなっているかどうかを判断するには、あなたの研究のコンテキストを知る必要があります。


貴重な情報をありがとう。しかし、私は重みを計算する方法について懸念がありますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.