異なる共分散の2つの2変量分布間のマハラノビス距離


8

質問はタイトルにかなり含まれています。異なる共分散行列の2つの分布のマハラノビス距離はどれくらいですか?これまでに見つけたものは、両方の分布に対して同じ共分散、つまり次のようなものを想定しています。

ΔTΣ1Δ

2つの異なるがある場合はどうなりΣますか?

注:-問題はこれです。同じ次元であるが、互いに回転および平行移動する2変量分布が2つあります(申し訳ありませんが、統計的なものではなく、純粋な数学的背景に由来します)。それらの重なり具合/距離を測定する必要があります。

* 更新:* 2つの分布の平均値の間の距離が必要だということを、私が尋ねていることで暗黙的であるかどうかはわかりません。平均がどこにあるわかっていますが、2つの分布は互いに対して回転しているため、異なる方向に異なる重みを割り当てる必要があるため、平均間の単純なユークリッド距離では機能しません。さて、私が理解しているように、分布が異なる形の場合、マハラノビス距離を使用してこの情報を測定することはできません(明らかに、同一の共分散の2つの多変量正規分布で機能しますが、一般的なケースでは機能しません)。異なる重みで向きをエンコードするというこの願いをエンコードする良い方法はありますか?


1
分布が異なる場合、マハラノビス距離は意味がありません。(「ピーターは球に住んでいて、ポールはユークリッド平面に住んでいます。どうすればそれらの間の距離を計算できますか?」と言うようなものです)おそらく、ステップをバックアップして、質問の動機を理解するのに役立ちます。ここで達成したいですか?統計的コンテキストとは何ですか?
whuber

さて、私はとても疑いました。:私が尋ねる理由は、私は「マハラノビス距離を計算するために使用されている以下の式を見てきた、またはそれが主張していることである私もわから者Aそれはありませんよマハラノビス距離; 私は主張されたものをそのまま反映しています。バタチャリヤ距離はその場所でうまく機能しますか?
ΔT\(Σ1Σ2\)1Δ
Kristian D'Amato

@ k-damatoマハラノビス距離は、分布ではなく、ポイント間の距離を測定します。
vqv 2011年

さて、誰かが上の方程式を意味のあるものとして認識していますか?デルタは変位ベクトルです。
Kristian D'Amato

@クリスチャン私はあなたの2つの重複したアカウントを統合しました。これからは登録したアカウントをご利用ください。
11年

回答:


6

確率分布間の距離については、多くの概念があります。どちらを使用するかは、目的によって異なります。 総変動距離は、分布間の重なりを測定する自然な方法です。多変量法線を使用している場合、カルバックライブラーダイバージェンスは数学的に便利です。これは実際には距離ではありませんが(対称であることができず、三角形の不等式に従うことができないため)、合計変動距離の上限になります。ピンスカーの不等式を参照してください。


2
ここでの最近のいくつかの議論は、適切なメトリックをもたらすKLの相違への変更に焦点を当てています。興味のある方は、こちらこちらをご覧ください。
枢機卿

3

イントロ @vqvが言及したように、トータルバリエーションとカルバックライブラーは興味深い距離です。最初のものは、仮説検定における1番目と2番目のタイプのエラーに直接関連している可能性があるため、意味があります。総変動距離の問題は、計算が難しいことです。カルバックレイブラー距離は計算が簡単で、後で説明します。それは対称的ではありませんが、対称的にすることができます(どういうわけか人工的に少し)。

回答 私は言及何かここではあればということである、あなたの2つのガウス対策間の対数尤度比であるP 0P 1は、(のためにと言う私は= 0を1つのP iの平均持ちμ Iおよび共分散C もintersetingされるエラー対策を) (ガウスの場合、私は実際にはかなり中心的であることがわかりました)LP0P1=01 PμCi

LL2(P1/2)2

選択されたウェルについてP1/2

簡単な言葉で

  • 共分散行列「補間」のいずれかを使用して式を用いて得られる別の興味深い「方向」回転、があるかもしれないiは= 1 2 3 4または5)の端部に定義されこの投稿の(番号5は、質問へのコメントで提案したものです)。 Σ=Ci,1/2i=1,2,3,455
  • 2つの分布の共分散は異なるため、平均を比較するだけでは不十分で、共分散も比較する必要があります。

これはあなたがの場合にこれを計算することができますどのように、私の気持ちですなぜ私はあなたを説明しましょうと選択する方法をP 1 / 2C1C0P1/2

線形の場合であればC1=C0=Σ

σ=ΔΣ1Δ=2LL2P1/22

ここで、との間の"補間"であり、P 1及びP 0(共分散を有するガウスΣ平均μ 1 + μ 0/ 2)。この場合、Hellinger距離、総変動距離はすべてσを使用して記述できることに注意してください。P1/2P1P0Σ(μ1+μ0)/2σ

一般的なケースでを計算する方法Lあなたの質問(および私のもの)から生じる自然な質問は、C 1C 0のときのP 0の間の自然な「補間」です。ここで自然という言葉はユーザー固有かもしれませんが、たとえば、別の距離(ここではL 1距離など)でタイトな上限を持つことは、最良の補間に関連している可能性があります。P1P0C1C0L1

足す i=0j=1)は、補間タスクがどこにあるかを確認するのに役立ちますが、次のようになります。

L=φC1/2バツμφCj1/2バツμj12ログCCj
=0j=1

Lバツ=12jバツsjバツsjRp+GjバツsjRpcj[1]

cij=1

j=CCjGj=SjメートルjSj=C+Cj2
cj=18jメートルjメートルjRp+12ログ|detCjC|

そして

メートルj=μμjadsj=μ+μj2

計算の目的により適しています。任意ガウスのために平均とS 01及び共分散Cの計算L 2 L 2P 1 / 2式から1ビット技術が、faisibleあります。カルバックレイブラー距離の計算にも使用できます。P1/2s01CLL2P1/221

我々は選ぶべきどのような補間(すなわち選択する方法をP1/2 それは明確式から理解されている1P1/2t[01]Pttμ1+1tμ0

  1. の分布として ξ 、T = T ξ 1 + 1 - T ξ 0 ξ iはから引き出されますPt1
    ξt=tξ1+1tξ0
    ξ iは= 0 1を共有している) C TをP =01Ct1=tC11/2+1tC01/22
  2. と逆共分散 C 1Pt2Ct21=tC11+1tC01
  3. PtCt,3=tC1+(1t)C0
  4. と逆共分散 C 1 t 4 =Pt4Ct,41=(tC11/2+(1t)C01/2)2

Ct,5=C1tC01t

私は最初の選択肢ではない私のお気に入りの選択肢を持っています:)ここでそれを議論する時間はあまりありません。多分私はこの答えを後で編集します...


2

これは古いですが、これを読んでいる他の人にとって、共分散行列はガウス分布の回転を反映し、平均は分布の平行移動または中心位置を反映しています。マハブ距離を評価するには、単純にD =((m2-m1)* inv((C1 + C2)/ 2)*(m2-m1) ')です。2つの2変量分布が同じであると思われるが、それらが回転していると思われる場合は、各分布の固有ベクトルと固有値の2つのペアを計算します。固有ベクトルは、主軸と副軸に沿った2変量データの広がりの方向を指し、固有値はこの広がりの長さを示します。固有値が同じ場合、2つの分布は同じですが回転します。固有ベクトル間の内積のacosを取り、回転角度を取得します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.