使用するのに最適な距離測定


12

環境

比較したい2組のデータがあります。両方のセット内の各データ要素は、(すべての間に22件の角度を含むベクターであるπ及びπ)。角度は特定の人間のポーズ構成に関連しているため、ポーズは22の関節角度によって定義されます。

最終的に私がやろうとしているのは、2つのデータセットの「近さ」を判断することです。そのため、1つのセットの各ポーズ(22Dベクトル)について、他のセットの最も近い隣を見つけ、最も近い各ペアの距離プロットを作成します。

ご質問

  • 単純にユークリッド距離を使用できますか?
    • :意味のあるものにするには、私は距離メトリックは、次のように定義される必要があることを前提と、ここで | | は絶対値で、modはモジュロです。次に、結果の22シータを使用して、標準のユークリッド距離計算を実行できます。√θ=|θ1θ2|modπ|...|t12+t22++t222
    • これは正しいです?
  • カイ2乗、Bhattacharyya、または他のメトリックなど、別の距離メトリックがより有用でしょうか?もしそうなら、その理由についての洞察を提供してください。

3
サイドノートとして:私はあなたが意味するとは思わない。むしろ min { | θ 1 - θ 2 | 2 π - | θ 1 - θ 2 | }|θ1θ2|modπmin{|θ1θ2|,2π|θ1θ2|}
エリックP.

4
角度を扱うのではなく、最初に単位円上の(x、y)座標に変換することをお勧めします。その後、通常の距離(距離など)を計算できます。平均化は角度のような問題ではありません。
カラカル

2
@Josh Erik P.の提案は良いものです。または、各角度を単位円上の点cos θ sin θ と見なし、通常の(ピタゴラスの)式を使用してそれらの間のユークリッド距離を計算します。これらの距離と角距離の違いは重要ではありません。(これは、カラカルが提案したものでもあると思います。)θ(cos(θ),sin(θ))
whuber

2
@Josh、例えば、平均 及び7 π / 4ですπ。多くの場合、これは意味をなさないため、代わりに0にする必要があります。特定の状況では、これは問題ではないかもしれません。なぜなら、人間の関節にはπを超える可動域がないからかもしれません。また、あなたの場合、関節の動きは単方向であるため、前述の平均をπにしたいかもしれません。@whuberの提案はまさに私が意図したものです。π/47π/4π0ππ
カラカル

3
「間違えた」ことの結果を特定できれば、おそらくあなたの問題ははるかに簡単に解決できるでしょう。データセットが同じまたは類似していると言っても、実際は同じではない場合、どうなりますか?それはあなたの決定が「どれだけ間違っている」かに依存しますか?異なるデータ/ポーズを宣言した場合、実際には同じまたは類似している場合はどうなりますか?何が失われますか?これらの質問に答えることで、比較の対象となるものを判断できます。これにより、正しい質問に確実に答えることができます。
確率の

回答:


5

各セットの共分散行列を計算し、マハラノビス距離を使用して2つのセット間のハウスドルフ距離を計算できます。

マハラノビス距離は、未知のサンプルセットと既知のサンプルセットの類似性を判断する便利な方法です。ユークリッド距離とは異なり、データセットの相関を考慮し、スケール不変です。


3

最近傍情報をどうしようとしていますか?

私はその質問に答え、それを踏まえて異なる距離測定を比較します。

たとえば、ジョイントの構成に基づいてポーズを分類しようとしており、同じポーズのジョイントベクトルを互いに近づけたいとします。異なる距離メトリックの適合性を評価する簡単な方法は、KNN分類器でそれらを使用し、結果の各モデルのサンプル外の精度を比較することです。


2

これは、情報検索(IR)の特定のアプリケーションに似ているように聞こえます。数年前、私はあなたがしていることに似た歩行認識についての講演に参加しました。情報検索では、「ドキュメント」(あなたの場合:人の角度データ)が何らかのクエリ(あなたの場合は「角度データを持つ人がいます(..、..)」など)と比較されます。次に、ドキュメントは、最も近いものから順に一致するものの順にリストされます。つまり、IRの中心的なコンポーネントの1つは、何らかの種類のベクトル空間(場合によっては角度空間)にドキュメントを配置し、それを特定のクエリまたはサンプルドキュメントと比較するか、距離を測定することを意味します。(以下を参照してください。)2つの個々のベクトル間の距離の適切な定義がある場合、あなたがしなければならないのは、2つのデータセットの距離の尺度を考え出すことです。(従来、IRではベクトル空間モデルの距離はコサイン測定またはユークリッド距離のいずれかで計算されますが、その場合にどのように行われたか覚えていません。)IRには、概念的に「関連性フィードバック」と呼ばれるメカニズムもあります、2セットのドキュメントの距離で機能します。そのメカニズムは、通常、ドキュメントのすべてのペア(または、あなたの場合は人のベクトル)間のすべての個々の距離を合計する距離の尺度を使用します。たぶんそれはあなたに役立つでしょう。

次のページで問題に関連するように見えるいくつかの論文を持っていますhttp://www.mpi-inf.mpg.de/~mmueller/index_publications.html 特にこの1 http://www.mpi-inf.mpg.de/ 〜mmueller / publications / 2006_DemuthRoederMuellerEberhardt_MocapRetrievalSystem_ECIR.pdfは興味深いようです。私が参加したミュラーの話では、コバールとグライヒャーの「点群」と呼ばれる類似性尺度(http://portal.acm.org/citation.cfm?id=1186562.1015760&coll=DL&dl=ACMを参照)と「四元数」と呼ばれるものに言及しています。 。それが役に立てば幸い。


あなたがそれを見つけることができるならば、それは参照を持つことは役に立ちます。ありがとう。
ジョシュ

2

この問題は、距離メトリック学習と呼ばれます。すべての距離メトリックは次のように表すことができますバツytAバツy どこ A正の半正です。このサブエリアの下のメソッドは、最適を学びますAあなたのデータのために。実際、最適な場合Aたまたま恒等行列である場合、ユークリッド距離を使用してもかまいません。逆共分散の場合、マハラノビス距離などを使用することが最適です。したがって、距離メトリック学習法を使用して、最適なA、適切な距離メトリックを学習します。


0

角度を形状のプロキシとして使用する場合の問題の1つは、角度の小さな摂動が形状の大きな摂動につながる可能性があることです。さらに、異なる角度構成は、同じ(または類似の)形状をもたらす可能性があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.