幾何学的解釈
質問で説明されている推定器は、次の最適化問題に相当するラグランジュ乗数です。
minimize f(β) subject to g(β)≤t and h(β)=1
f(β)g(β)h(β)=∥y−Xβ∥2=∥β∥2=∥Xβ∥2
幾何学的に見ると、球体と楕円体の交点に触れる最小の楕円体を見つけることができます。f(β)=RSS g(β)=th(β)=1
標準リッジ回帰ビューとの比較
幾何学的な観点から見ると、これは、回転楕円体(エラー)と球体()が接触する点の(標準的なリッジ回帰の)古いビューを変更します。我々はポイントを探し、新しいビューに回転楕円体(エラー)は、曲線(ベータによって制約のノルム触れる)。制約との交差により、1つの球体(左の画像では青)が低次元の図に変化します。∥β∥2=t∥Xβ∥2=1∥Xβ∥=1
2次元の場合、これは表示が簡単です。
パラメーターを調整する場合、青/赤球の相対的な長さ、またはとの相対的なサイズを変更します(ラグランジュ乗数の理論では、おそらく正式にまさにそのそれぞれについて、この手段が記述の関数としての、あるいは逆に、単調な関数である。しかし、私はあなたが我々が減少したときに残差二乗和が唯一増加することを直感的に見ることができることを想像。)tf(β)g(β) tλ||β||
のソリューションは、0と間の行で議論したβλλ=0βLS
ソリューションため第一主成分の負荷に(実際にあなたがコメントしたように)です。これは、場合にが最小になるです。これは、円が単一の点で楕円に触れる点です。βλλ→∞∥β∥2∥βX∥2=1∥β∥2=t|Xβ|=1
この2次元表示では、球体と回転楕円体の交点のエッジは点です。複数の次元では、これらは曲線になります∥β∥2=t∥βX∥2=1
(私はこれらの曲線は楕円になりますが、それらはより複雑にしていることを最初に想像した。あなたは楕円想像球が交差しているなどの一部を楕円錐台のようなものですが、エッジは単純な楕円ではありません)∥Xβ∥2=1∥β∥2≤t
制限についてλ→∞
最初に(以前の編集)、すべての解が同じである(そしてそれらがポイント存在する)制限的ながあることを書きました。しかし、これはありません場合λlimβ∗∞
LARSアルゴリズムまたは勾配降下として最適化を検討してください。任意のポイントのためならば我々は変更することができている方向があるペナルティ項よう増加少ないSSRの項より、あなたが最小ではない減少は、 。ββ|β|2|y−Xβ|2
- では、通常のリッジ回帰あなたがのために(すべての方向に)ゼロスロープ持っポイントで。したがって、すべての有限の、解ははなりません(ペナルティを増加させることなく、残差の2乗の合計を減らすために無限小ステップを行うことができるため)。|β|2β=0λβ=0
- LASSOの場合、これは同じではありません。ペナルティは(したがって、勾配がゼロの2次関数ではありません)。そのためLASSOには、ペナルティ項(乗算)が残差平方和が減少するよりも大きくなるため、すべての解がゼロになる制限値があります。|β|1λlimλ
- 拘束された尾根では、通常の尾根回帰と同じ結果が得られます。あなたが変更した場合はから始まる、この変更は次のようになります垂直に(楕円形の表面に対して垂直である)およびは、ペナルティ項を変更せずに残差の2乗和を減少させることなく、微小ステップで変更できます。したがって、任意の有限の、点は解になりません。ββ∗∞ββ∗∞|Xβ|=1βλβ∗∞
制限に関するさらなる注意λ→∞
無限大への通常のリッジ回帰制限は、制約付きリッジ回帰の異なる点に対応します。この「古い」制限は、が-1に等しいポイントに対応します。次に、正規化された問題のラグランジュ関数の導関数λμ
2(1+μ)XTXβ+2XTy+2λβ
は、標準問題のラグランジュ関数の導関数の解に対応します。
2XTXβ′+2XTy+2λ(1+μ)β′with β′=(1+μ)β
StackExchangeStrikeによって書かれました。