アースムーバの距離は次のように書くことができる infimumはすべての関節分布引き継がれ、XおよびY周辺分布とX \シムP、Y \シムQ。これは、最初として知られているワッサー距離であり、^ {1 / P} - W_p = \ INF \左(Y \ rVert ^ P \右\ E \ lVert X)同じinfimum有します。EMD(P,Q)=infE∥X−Y∥XYX∼PY∼QWp=inf(E∥X−Y∥p)1/p
ましょX∼P=N(μx,Σx)、Y∼Q=N(μy,Σy)。
下はバインド:ジェンセンの不等式では、規範は、凸状であるため、
E∥X−Y∥≥∥E(X−Y)∥=∥μx−μy∥,
EMDが常にあるので、少なくとも平均間の距離(すべての分布)。
アッパーには基づいて拘束W2:
再びジェンセンの不等式によって
(E∥X−Y∥)2≤E∥X−Y∥2。したがって、W1≤W2。しかし、Dowson and Landau(1982)は、
W2(P、Q )2= ∥はμバツ- μy∥2+ t r(Σバツ+ Σy−2(ΣxΣy)1/2),
EMD=W1
上限を指定します。
より厳しい上限:
カップリングを考慮
これは、Knott and Smith(1984)によって導出されたマップです、分布の最適マッピングについて、最適マッピングとして、Journal of Optimization Theory and Applications、43(1)pp 39-49 ; このブログ投稿も参照してください。なお、と
XY∼N(μx,Σx)=μy+Σ−12x(Σ12xΣyΣ12x)12Σ−12xA(X−μx).
W2A=ATEYVarY=μy+A(EX−μx)=μy=AΣxAT=Σ−12x(Σ12xΣyΣ12x)12Σ−12xΣxΣ−12x(Σ12xΣyΣ12x)12Σ−12x=Σ−12x(Σ12xΣyΣ12x)Σ−12x=Σy,
したがって、カップリングは有効です。
距離は、ここで
これはと正常です
∥X−Y∥∥D∥D=X−Y=X−μy−A(X−μx)=(I−A)X−μy+Aμx,
EDVarD=μx−μy=(I−A)Σx(I−A)T=Σx+AΣxA−AΣx−ΣxA=Σx+Σy−Σ−12x(Σ12xΣyΣ12x)12Σ12x−Σ12x(Σ12xΣyΣ12x)12Σ−12x.
したがって、上限はです。残念ながら、この期待のための閉じた形は、一般的な多変量法線のために書き留めて驚くほど不快である:参照この質問だけでなく、これを。W1(P,Q)E∥D∥
分散した場合(あれば例えば球状されて終わる、、その後の分散なった、旧) questionは、一般化されたラゲール多項式の観点から答えを与えます。DΣx=σ2xIΣy=σ2yID(σx−σy)2I
一般に、の不等式に基づいた単純な上限は、たとえばその最初の質問で導かれ:
E∥D∥(E∥D∥)2≤E∥D∥2=∥μx−μy∥2+tr(Σx+Σy−AΣx−ΣxA)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr(Σ−12x(Σ12xΣyΣ12x)12Σ12x)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr((Σ12xΣyΣ12x)12)=W2(P,Q)2.
最後の等式は、行列とが類似しているためです。 、したがって、それらは同じ固有値を持ち、したがって、それらの平方根は同じトレースを持ちます。ΣxΣyΣ12xΣyΣ12x=Σ−12x(ΣxΣy)Σ12x
が縮退しない限り、この不等式は厳密です。これは、ほとんどの場合、です。∥D∥Σx≠Σy
推測:おそらくこのより近い上限はきつい。繰り返しになりますが、ここでは長い間別の上限がありましたが、実際はよりも緩いとタイトであると推測していました。したがって、この推測をあまり信頼しないでください。:)E∥D∥W2