回帰に正則化方法を使用する場合


83

どのような状況で、OLSの代わりに正則化方法(リッジ、投げ縄または最小角度回帰)の使用を検討する必要がありますか?

これが議論の舵取りに役立つ場合、私の主な関心は予測精度の向上です。

回答:


75

簡単な答え:これらの状況のいずれかに直面しているときはいつでも:

  • 多数の変数または低い比率。いいえへの観察。変数(場合を含む)、np
  • 高い共線性、
  • 疎なソリューションを探します(モデルモデルを推定するときに特徴選択を埋め込む)、または
  • 高次元データセット内のグループ化された変数の説明。

リッジ回帰は一般に、バイアスと分散の間のより良い妥協を通して、OLSソリューションよりもより良い予測をもたらします。その主な欠点は、すべての予測変数がモデルに保持されることです。そのため、節約的なモデルを探したり、何らかの種類の特徴選択を適用したりすることはあまり面白くありません。

スパース性を達成するには、投げ縄がより適切ですが、高い共線性の存在下で必ずしも良い結果が得られるとは限りません(予測子が高度に相関している場合、投げ縄の予測パフォーマンスはリッジ回帰によって支配されることが観察されています)。L1ペナルティの2番目の問題は、変数の数が被験者の数よりも大きい場合、投げ縄解が一意に決定されないことです(これはリッジ回帰の場合ではありません)。投げ縄の最後の欠点は、ペアワイズ相関が高い予測変数のグループから1つの変数のみを選択する傾向があることです。この場合、グループ(つまり、共変量のブロックで収縮を達成する、つまり回帰係数の一部のブロックが正確にゼロになる)や融合のような代替ソリューションがあります。なげなわ。グラフィカルな投げ縄はまた、(Rの参照GGMsのための有望な機能を提供していますglassoのパッケージを)。

ただし、L1とL2のペナルティの組み合わせであるelasticnet基準は、収縮と自動変数選択の両方を実現し、場合に変数を維持することを可能にします。Zou and Hastie(2005)に続いて、最小化する引数として定義されています(超える)m>pnpβ

L(λ1,λ2,β)=YXβ2+λ2β2+λ1β1

ここで、および。β2=j=1pβj2β1=j=1p|βj|

投げ縄は、Friedman and coll。による最近の論文、Coordinate Descentによる一般化線形モデルの正則化パス(JSS、2010)またはLARSアルゴリズムで説明されている座標降下に基づくアルゴリズムで計算できます。Rにおいて、献上ラース又はbiglars、及びglmnetのパッケージは、パッケージに有用です。Pythonにはscikit.learnツールキットがあり、3種類すべての正規化スキームを適用するために使用されるアルゴリズムに関する詳細なドキュメントがあります。

一般的な参照については、投げ縄のページには、投げ縄回帰とL1ペナルティに関する技術的な詳細を開始するために必要なもののほとんどが含まれています。


1
比較的変数が少なく、S / N比が非常に低い観測値が多数ある場合はどうなりますか?実際、非常に低いため、過剰適合は非常に現実的な問題です。正則化は、予測精度を向上させるために試してみるべき賢明なことでしょうか?
NPE

1
@aix実際に数少ない変数と呼ぶものと、どの種類の変数を扱っているかによって異なります。しかし、私はあなたの場合、尾根アプローチが好まれると思います。あなたも見ることができリッジ回帰ブースト(Tutz&バインダー、2005)。過適合を防ぐための組み込み方法として、ペナルティML推定も提案されました。たとえば、バイナリ結果を予測するためのペナルティ付き最尤推定を参照してください:Moons KG、Donders AR、Steyerberg EW、Harrell FE。J. Clin。エピデミオール。2004、57(12):1262–70。
chl

20

リッジ回帰の使用の理論的な正当化は、その解が係数の正規事前分布を与えられた事後平均であるということです。つまり、二乗誤差を気にし、通常の事前分布を信じている場合、リッジ推定値が最適です。

同様に、投げ縄推定は、係数の事前の二重指数関数の下での事後モードです。これは、ゼロ1損失関数の下で最適です。

実際には、これらの手法は通常、相関変数が多く、データが多くない状況での予測精度を向上させます。OLS推定器は最適な線形不偏ですが、これらの状況では高い分散を持ちます。バイアスと分散のトレードオフを見ると、バイアスのわずかな増加が分散の大きな減少によって相殺される以上に予測精度が向上します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.