質問は、リッジ回帰がスペクトル分解を使用して係数推定値をゼロに縮小することの実証を求めているようです。スペクトル分解は、特異値分解(SVD)の簡単な結果として理解できます。したがって、この投稿はSVDで始まります。簡単な用語で説明し、重要なアプリケーションで説明します。次に、要求された(代数的)デモンストレーションを提供します。(もちろん、代数は幾何学的なデモンストレーションと同一であり、単に異なる言語で表現されています。)
この回答の元のソースは、回帰コースのノートに記載されています。このバージョンでは、いくつかの小さなエラーが修正されています。
SVDとは
任意行列と、、書き込むことができます場所n×pXp≤n
X=UDV′
Uは行列です。n×p
- の列の長さはです。U1
- の列は相互に直交しています。U
- 彼らは呼ばれている主成分の。X
Vは行列です。p×p
- の列の長さはです。V1
- の列は相互に直交しています。V
- この作るは回転の。VRp
Dは対角 行列です。p×p
- 対角要素は負ではありません。これらはの特異値ですd11,d22,…,dpp。X
- 必要に応じて、大きいものから小さいものへと注文できます。
基準(1)と(2)は、とVの両方が正規直交行列であることを表明しています。それらは条件によってきちんと要約することができますUV
U′U=1p, V′V=1p.
結果として(は回転を表す)、V V ′ = 1 pも。これは、以下のリッジ回帰の導出で使用されます。VVV′=1p
それは私たちのために
数式を簡素化できます。 これは代数的および概念的に機能します。下記は用例です。
正規方程式
回帰考えるいつものように、ここで、εは独立しており、同様にゼロ期待と有限の分散有する法則によれば、分散σ 2。正規方程式を介して、最小二乗解は、β = (X ' X )- 1 X '、Y 。 SVDを適用し、結果として得られる代数的混乱を単純化する(これは簡単です)と、素晴らしい洞察が得られます。y=Xβ+εεσ2
β^=(X′X)−1X′y.
(X′X)−1X′=((UDV′)′(UDV′))−1(UDV′)′=(VDU′UDV′)−1(VDU′)=VD−2V′VDU′=VD−1U′.
これとの唯一の違いは、Dの要素の逆数が使用されることです!換言すれば、「式」Y = X β「反転」することによって解決されるX:この疑似反転アンドゥを回転UとV ' (単にそれらを転置することによって)及びアンドゥ(で表される乗算D)別々に各主に方向。X′=VDU′Dy=XβXUV′D
将来の参照のために、推定「回転」という通知 βは、応答「回転」の線形組合せであるU ' yと。係数は、Dの(正の)対角要素の逆数であり、d − 1 i iに等しくなります。V′β^U′yDd−1ii
係数推定値の共分散
推定値の共分散であることを想起されたい SVDを使用し、これはなるσ 2(V D 2 V ' )- 1 = σ 2 V D - 2 V '。 言い換えれば、共分散はk個の直交変数の共分散のように機能し、それぞれが分散d 2 i i
Cov(β^)=σ2(X′X)−1.
σ2(VD2V′)−1=σ2VD−2V′.
k d2ii、
回転されています。
Rk
ハットマトリックス
H=X(X′X)−1X′.
H=(UDV′)(VD−1U′)=UU′.
固有分析(スペクトル分解)
X′X=VDU′UDV′=VD2V′
XX′=UDV′VDU′=UD2U′,
- X′XXX′
- VX′X
- UXX′
SVDは、共線性の問題を診断および解決できます。
回帰変数の近似
UDV′Uy
リッジ回帰
XyXλ>0
β^R=(X′X+λ)−1X′y=(VD2V′+λ1p)−1VDU′y=(VD2V′+λVV′)−1VDU′y=(V(D2+λ)V′)−1VDU′y=V(D2+λ)−1V′VDU′y=V(D2+λ)−1DU′y.
β^D−1=D−2D(D2+λ)−1DD2/(D2+λ)λ>0
V′β^RU′yd−1iid2ii/(d2ii+λ)λβ^R
d−1ii