2つのガウス間のアースムーバーの距離(EMD)


26

以下のための閉じた形の式(または上に結合のいくつかの種類)との間にEMDありx1N(μ1,Σ1)および?x2N(μ2,Σ2)


2
en.wikipedia.org/wiki/Earth_mover%27s_distanceによると 、EMDはMallowsまたはWassersteinの距離と同じなので、googlinを試すことができます。
kjetil bハルヴォルセン14

2
この論文は役に立つかもしれません:vldb.org/pvldb/vol5/p205_brianeruttenberg_vldb2012.pdf
jojer

回答:


27

アースムーバの距離は次のように書くことができる infimumはすべての関節分布引き継がれ、XおよびY周辺分布とX \シムPY \シムQ。これは、最初として知られているワッサー距離であり、^ {1 / P} - W_p = \ INF \左(Y \ rVert ^ P \右\ E \ lVert X)同じinfimum有します。EMD(P,Q)=infEXYXYXPYQWp=inf(EXYp)1/p

ましょXP=N(μx,Σx)YQ=N(μy,Σy)

下はバインド:ジェンセンの不等式では、規範は、凸状であるため、

EXYE(XY)=μxμy,
EMDが常にあるので、少なくとも平均間の距離(すべての分布)。

アッパーには基づいて拘束W2 再びジェンセンの不等式によって (EXY)2EXY2。したがって、W1W2。しかし、Dowson and Landau(1982)は、

W2(P,Q)2=μxμy2+tr(Σx+Σy2(ΣxΣy)1/2),
EMD=W1 上限を指定します。

より厳しい上限: カップリングを考慮 これは、Knott and Smith(1984)によって導出されたマップです分布の最適マッピングについて、最適マッピングとして、Journal of Optimization Theory and Applications、43(1)pp 39-49 ; このブログ投稿も参照してください。なお、と

XN(μx,Σx)Y=μy+Σx12(Σx12ΣyΣx12)12Σx12A(Xμx).
W2A=AT
EY=μy+A(EXμx)=μyVarY=AΣxAT=Σx12(Σx12ΣyΣx12)12Σx12ΣxΣx12(Σx12ΣyΣx12)12Σx12=Σx12(Σx12ΣyΣx12)Σx12=Σy,
したがって、カップリングは有効です。

距離は、ここで これはと正常です XYD

D=XY=XμyA(Xμx)=(IA)Xμy+Aμx,
ED=μxμyVarD=(IA)Σx(IA)T=Σx+AΣxAAΣxΣxA=Σx+ΣyΣx12(Σx12ΣyΣx12)12Σx12Σx12(Σx12ΣyΣx12)12Σx12.

したがって、上限はです。残念ながら、この期待のための閉じた形は、一般的な多変量法線のために書き留めて驚くほど不快である:参照この質問だけでなく、これをW1(P,Q)ED

分散した場合(あれば例えば球状されて終わる、、その後の分散なった、旧) questionは、一般化されたラゲール多項式の観点から答えを与えます。DΣx=σx2IΣy=σy2ID(σxσy)2I

一般に、の不等式に基づいた単純な上限は、たとえばその最初の質問で導かれ: ED

(ED)2ED2=μxμy2+tr(Σx+ΣyAΣxΣxA)=μxμy2+tr(Σx)+tr(Σy)2tr(Σx12(Σx12ΣyΣx12)12Σx12)=μxμy2+tr(Σx)+tr(Σy)2tr((Σx12ΣyΣx12)12)=W2(P,Q)2.
最後の等式は、行列とが類似しているためです。 、したがって、それらは同じ固有値を持ち、したがって、それらの平方根は同じトレースを持ちます。ΣxΣyΣx12ΣyΣx12=Σx12(ΣxΣy)Σx12

が縮退しない限り、この不等式は厳密です。これは、ほとんどの場合、です。DΣxΣy

推測:おそらくこのより近い上限はきつい。繰り返しになりますが、ここでは長い間別の上限がありましたが、実際はよりも緩いとタイトであると推測していました。したがって、この推測をあまり信頼しないでください。:)EDW2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.