カーネルリッジ回帰の効率


10

リッジ回帰はとして表すことができますここで、は予測ラベルです、、行列を識別我々はのためのラベルを見つけようとしているオブジェクト、そしての行列オブジェクトように:

y^=(XX+aId)1Xx
y^Idd×dxXn×dnxi=(xi,1,...,xi,d)Rd

X=(x1,1x1,2x1,dx2,1x2,2x2,dxn,1x1,2xn,d)

これを次のようにカーネル化できます:

y^=(K+aId)1k

ここで、はカーネル関数行列ですKn×nK

K=(K(x1,x1)K(x1,x2)K(x1,xn)K(x2,x1)K(x2,x2)K(x2,xn)K(xn,x1)K(xn,x2)K(xn,xn))

そしてカーネル関数の列ベクトルkn×1K

k=(K(x1,x)K(x2,x)K(xn,x))

質問:

(a)ディメンションよりも多くのオブジェクトがある場合、カーネルを使用しないことは理にかなってますか?例えばせである行列次いでであろう、我々は反転してしまうの代わりに、マトリックスカーネルを使用するには、行列を反転する必要があります。これは、場合、カーネルを使用しないことを意味しますか?xiX50×3XX3×33×350×50dn

(b)可能な限り単純なカーネルを使用する必要がありますか?リッジ回帰のカーネルは、次元数の影響を打ち消すため、および(サポートベクターマシンとは異なり)特徴空間の特定のプロパティを利用しないために使用されているようです。ただし、カーネルはオブジェクト間の距離を変更できるため、リッジ回帰でよく使用されるカーネルはありますか?

(c)リッジ回帰および/またはカーネルリッジ回帰の時間の複雑さは何ですか?O


「効率」は統計学では異なる意味を持っています。「計算の複雑さ」という意味ですか?(タイトル内)
2013

「アルゴリズム効率」を意味しました。私の質問は、これを本質的に「計算の複雑さ」に減らすことは事実ですが。
Helix

回答:


5

(a)カーネルを使用する目的は、この場合の非線形回帰問題を解くことです。優れたカーネルを使用すると、おそらく無限次元の特徴空間で問題を解決できます。ただし、線形カーネルを使用し、双対空間でカーネルリッジ回帰を行うことは、主空間で問題を解決することと同じです。つまり、それは何の利点ももたらしません(観察したサンプル数が増えるにつれて、それははるかに遅くなります)。K(x,y)=xy

(b)最も一般的な選択肢の1つは、二乗指数カーネルこれは普遍的です(以下の参考文献を参照)。多くのカーネルがあり、それぞれが特徴空間に異なる内積(したがってメトリック)を誘導します。K(x,y)=exp(τ2||xy||2)

(c)の直接の実装は、サイズの一次方程式を解く必要それのように、。Nyström近似など、より高速な近似方法は多数あります。これは活発な研究の領域です。nO(n3)

参照:

  1. Bharath Sriperumbudur、Fukumizu Kenji、Gert Lanckriet。普遍性、特徴的な核、RKHSの測定値の埋め込みの関係について。Journal of Machine Learning Research、9:773–780、2010年。
  2. Bernhard Schlkopf、Alexander J. Smola。カーネルを使用した学習:サポートベクターマシン、正則化、最適化、および 2002年以降
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.