回答:
LASSO(最小絶対収縮および選択演算子)は、回帰係数の絶対サイズにペナルティを課す回帰方法です。
ペナルティを課す(または推定値の絶対値の合計を同等に制約する)ことにより、パラメータ推定値の一部が正確にゼロになる場合があります。適用されるペナルティが大きいほど、推定値はゼロに向かって縮小されます。
これは、いくつかの自動機能/変数選択が必要な場合、または標準回帰に通常「大きすぎる」回帰係数が含まれる高度に相関した予測子を処理する場合に便利です。
https://web.stanford.edu/~hastie/ElemStatLearn/(無料ダウンロード)には、LASSOと関連するメソッドの説明があります。
「通常」回帰(OLS)の目標は、係数を推定するために残差平方和(RSS)を最小化することです。
LASSO回帰の場合、わずかに異なるアプローチで係数を推定します。
新しい部分は赤で強調表示されます。これは、によってペナルティが課される絶対係数値の合計であるため、は(L1)の再調整の量を制御します。
場合、単純線形回帰の係数と同じ係数になることに注意してください。この式は、LASSO場合、RSSとL1のレギュレーション(新しい赤い部分)を最小限にする必要があることを示しています。場合の係数のみRSSの減少の同じ量にこのリード場合に増加させることができるように、赤色L1ペナルティは、係数の大きさを制約します。より一般的には、係数が増加する唯一の方法は、残差平方和(RSS)が同等に減少する場合です。したがって、高く設定するほどより多くのペナルティが係数に適用され、係数が小さくなると、ゼロになる場合があります。これは、LASSOが機能選択を行うことでpar約的なモデルになり、モデルが過剰適合するのを防ぐことができることを意味します。ただし、多くの機能があり、モデルの係数を解釈するのではなくデータを予測することが目標である場合は、LASSOを使用できます。