RidgeまたはLasso回帰は実際にどのように機能しますか?


7

ここで非常に基本的な質問ですが、残差平方和に「ペナルティ」(係数の2乗の和とスカラーの和)を追加すると、大きな係数をどのように減らすことができるか(数学ではなく)を理解したいと思います。ありがとう!


回答:


5

最小化問題の "ペナルティ"表現は、制約最適化問題の不規則な形にすぎないためです。

中央揃えの変数を想定します。lassoとridgeのどちらの場合も、制約のないターゲット関数は、通常の二乗残差の合計です。つまり、最小化するリグレッサを指定: すべての\ boldsymbol {\ beta} =(\ beta_1、\ dots、\ beta_p)についてp

RSSβ=Σ=1yバツ1β1++バツpβp2
β=β1βp

リッジ回帰の場合は、を最小化して、 値を指定します。小さな値の場合、最小限に抑えるだけの標準的な最小二乗シナリオと同じ解決策を導き出すことは不可能ですについて考えてから、なる可能性のある解のみ。RSSβ

Σ=1pβp2trdge
trdge0trdgeRSSβtrdge=0β1βp=0

一方、投げ縄の場合は、 をの制約の下で 最小化します 一部の。RSSβ

Σ=1p|βp|tlasso
tlasso0

両方の制約付き最適化問題は、制約なしの最適化問題の観点から同等にフォーラム化できます。つまり、投げ縄の場合:同等に最小化できます

Σ=1yバツ1β1++バツpβp2+λlassoΣ=1p|βp|

おかげで、「制約付きから制約なし」の部分を深く
掘り下げる
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.