L2によるコメントで提案されている距離。これは:
のセクション8.1.8の例に見られるように、ことに注意マトリックス料理:
なので、時間で簡単に評価できます。L2(P,Q)2=∫(p(x)−q(x))2dx=∫(∑iαipi(x)−∑jβjqj(x))2dx=∑i,i′αiαi′∫pi(x)pi′(x)dx+∑j,j′βjβj′∫qj(x)qj′(x)dx−2∑i,jαiβj∫pi(x)qj(x)dx.
∫N(x;μ,Σ)N(x;μ′,Σ′)dx=N(μ;μ′,Σ+Σ′)
O(mn)
ガウスRBFカーネルでの最大平均不一致(MMD)。これはクールな距離ですが、統計コミュニティの間ではまだあまり知られていません。これを定義するには少し計算が必要です。
まかせ
ヒルベルト空間定義などを対応する再生カーネルヒルベルト空間:。k(x,y):=exp(−12σ2∥x−y∥2),
Hkk(x,y)=⟨φ(x),φ(y)⟩H
平均マップカーネルをとして
定義しますK(P,Q)=EX∼P,Y∼Qk(X,Y)=⟨EX∼Pφ(X),EY∼Qφ(Y)⟩.
MMDは、次に
MMD(P,Q)=∥EX∼P[φ(X)]−EY∼Q[φ(Y)]∥=K(P,P)+K(Q,Q)−2K(P,Q)−−−−−−−−−−−−−−−−−−−−−−−−−√=supf:∥f∥H≤1EX∼Pf(X)−EY∼Qf(Y).
と混合では、
あり、とでも同様です。PQK(P,Q)=∑i,jαiβjK(Pi,Qj)
K(P,P)K(Q,Q)
と同様のトリックを使用して、は
であることがL2K(N(μ,Σ),N(μ′,Σ′))(2πσ2)d/2N(μ;μ′,Σ+Σ′+σ2I).
同様に、の倍数に明確にこの収束距離。ただし、通常はデータバリエーションの規模に応じて、別のを使用する必要があります。σ→0L2σ
閉じた形式は、MMDの多項式カーネルにも使用できます。見るk
Muandet、Fukumizu、Dinuzzo、およびSchölkopf(2012)。サポートメジャーマシンによる分布からの学習。事前の神経情報処理システム(公式版)。arXiv:1202.6504。
この距離の多くの優れた特性については、
Sriperumbudur、Gretton、Fukumizu、Schölkopf、およびLanckriet(2010)。ヒルベルト空間の埋め込みと確率測度に関する指標。Journal of Machine Learning Research、11、1517〜1561。arXiv:0907.5309。