動径基底関数がカーネルであることを証明する方法は?


35

動径基底関数がカーネルであることを証明する方法は?私の知る限り、これを証明するためには、次のいずれかを証明する必要があります。k(x,y)=exp(||xy||2)2σ2)

  1. ベクトルのセットマトリックス =は半正定です。x1,x2,...,xnK(x1,x2,...,xn)(k(xi,xj))n×n

  2. =ようなマッピングを提示できます。Φk(x,y)Φ(x),Φ(y)

何か助け?


1
より明確にリンクするために、この質問で機能マップについても説明します。特に、テイラー級数とRKHSとダグラスが提供する埋め込みの一般的なバージョンの両方を議論する鉱山シリーズに基づいたマーククレーセンの答えL2
ドゥーガル

回答:


26

禅は、ここで方法1を使用した方法2:地図中心とする球対称ガウス分布にヒルベルト空間における。これが正確に機能するためには、標準偏差と定数係数を微調整する必要があります。たとえば、ある次元では、xxL2

exp[(xz)2/(2σ2)]2πσexp[(yz)2/(2σ2)2πσdz=exp[(xy)2/(4σ2)]2πσ.

したがって、標準偏差を使用し、ガウス分布をスケーリングしてを取得します。この最後の再スケーリングは、正規分布のL ^ 2ノルムが一般に1ではないために発生します。 KXY=ΦXΦYL21σ/2k(x,y)=Φ(x),Φ(y)L21


2
@ Zen、Douglas Zare:すばらしい回答をありがとう。公式の回答を今すぐ選択するにはどうすればよいですか?
レオ

23

方法1を使用します。方法2を使用して、Douglas Zareの回答を確認してください。

とき、私はケースを証明する実数であるので、K X Y = EXP - X - Y 2 / 2 σ 2。一般的なケースは、同じ議論から必要な変更を加えたものであり、実行する価値があります。バツyk(x,y)=exp((xy)2/2σ2

一般性を失うことなく、その仮定σ2=1

を書きます。ここで、h t = exp t 2kバツy=hバツyは、分布を持つ確率変数Zの特性関数です。

ht=expt22=E[etZ]
ZN01

実数および場合、 これはが正の半正定関数、つまりカーネルあることを伴います。a 1a n n j k = 1 a jバツ1バツna1an

j,k=1najakh(xjxk)=j,k=1najakE[ei(xjxk)Z]=E[j,k=1najeixjZakeixkZ]=E[|j=1najeixjZ|2]0,
k

この結果をより一般的に理解するには、Bochnerの定理をチェックしてください:http : //en.wikipedia.org/wiki/Positive-definite_function


2
これは、2つの注意事項がある正しい方向の良い出発点です。(a)は表示された期待値と等しくありません(指数の符号を確認してください)。(b)これは、xyはスカラーであり、ベクトルではありません。博覧会は素晴らしく、きれいであり、これらの小さなギャップをすぐに埋めることができると確信しているので、その間は賛成しました。:h(t)xy
枢機

1
Tks!ここで急いでいます。:

1
申し訳ありませんが、ここで必要な変更を加えた方法はわかりません。フォームに渡す前にノルムを開発すると、製品を得て、製品と合計を交換することはできません。そして、私は単に、いい形を得るためにh形に渡した後、ノルムをどのように展開するかわかりません。私をそこに少し連れて行ってもらえますか?:)h
Alburkerk

23

さまざまな目的のために、3番目の方法を追加します。pdカーネルを作成することが知られている一連の一般的な手順からカーネルを構築します。レッツ以下のカーネルとのドメイン表しφ特徴マップを。Xφ

  • スケーリング: 場合 PDカーネルがある、そうであるγ κ任意の定数のγ > 0でκγκγ>0

    証明:κの特徴マップの場合、φκのための有効な特徴マップですγκγφγκ

  • 合計: 場合は及びκ 2は、PDカーネルです、そうですκ 1 + κ 2κ1κ2κ1+κ2

    証明:連結し、特徴がマップ及びφ 2を取得するために、X [ φ 1X )、φ 2X ]φ1φ2x[φ1(x)φ2(x)]

  • 限界: 場合 PDカーネルであり、κ X Y = LIM N κ NX Yは全てに対して存在するX Y、次いで、κは PDです。κ1,κ2,κ(x,y):=limnκn(x,y)x,yκ

    証明:それぞれについてとすべて{ X IC I} mはI = 1X × R我々は持っているΣはmのiは= 1つの、C I κ nとX IX JC J0。制限をn ∞とすると、κに対して同じプロパティが得られます。m,n1{(xi,ci)}i=1mX×Ri=1mciκn(xi,xj)cj0nκ

  • 製品: 場合及びκ 2は、 PDのカーネルであり、そうであるGはX Y = κ 1X Y κ1κ2g(x,y)=κ1(x,y)κ2(x,y)

    証明:Schurの積定理からすぐに続きますが、Schölkopfand Smola(2002)は次の素晴らしく初歩的な証明を与えます。してみましょう 独立です。したがって、 C o vV i W iV j W j= C o vV iV j

    (V1,,Vm)N(0,[κ1(xi,xj)]ij)(W1,,Wm)N(0,[κ2(xi,xj)]ij)
    共分散行列は、の共分散行列考慮ので、PSDでなければならないV 1 、W 1... V N 、W Nはそれを証明しています。
    Cov(ViWi,VjWj)=Cov(Vi,Vj)Cov(Wi,Wj)=κ1(xi,xj)κ2(xi,xj).
    (V1W1,,VnWn)
  • パワーズ: 場合 PDカーネルが、そうであるκ NX Y = κ X Y nは任意の正の整数を、nはκκn(x,y):=κ(x,y)nn

    証明:「products」プロパティから直接。

  • 指数: 場合 PDカーネルが、そうであるE κX Y = EXP κ X Y κeκ(x,y):=expκバツy

    eκ(x,y)=limNn=0N1n!κ(x,y)n

  • κf:XRg(x,y):=f(x)κ(x,y)f(y)

    xf(x)φ(x)

k(x,y)=exp(12σ2xy2)=exp(12σ2x2)exp(1σ2xTy)exp(12σ2y2).
κ(x,y)=xTy1σ2xexp(12σ2x2)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.