なげなわペナルティはリグレッサのサブセットにのみ適用されます


7

この質問は以前に聞いたことがありますが、回答がなかったので、もう一度尋ねるかもしれません。

なげなわペナルティをリグレッサの一部のサブセット、つまり目的関数に適用することに興味があります

E=||yX1β1X2β2||2+λ||β1||1

なげなわは\ boldsymbol {\ beta} _1にのみ適用されますβ1が、β2は再構築に関与します。

この背後にある理論はありますか?第二に、とにかくこれをsklearnで行うことはありますか?

回答:


6

してみましょうの列空間への直交プロジェクターも。我々はそれを持っている ここで H2X2

minβ1,β2{yX1β1X2β222+λβ11}=minβ1,β2{H2(yX1β1)X2β222+(IH2)(yX1β1)22+λβ11}=minβ1|β2minβ2{H2(yX1β1)X2β222+(IH2)(yX1β1)22+λβ11},
β^2=argminβ2{H2(yX1β1)X2β222+(IH2)(yX1β1)22+λβ11}=argminβ2{H2(yX1β1)X2β222}
はすべてのに対して以降 for all。この文では、がフルランクである場合を考える、ため、この場合は。X2β^2=H2(yX1β1)β1H2(yX1β1)col(X2)β1X2
β^2=(X2TX2)1X2T(yX1β1),
H2=X2(X2TX2)1X2

これを最初の最適化問題に組み込むと、 これは通常の投げ縄計算ツールで評価できます。whuberが彼のコメントで示唆しているように、無制限の係数はのスパンをカバーできるため、評価するときにのスパンに直交する空間の部分のみが問題になるため、この結果は直観的。

β^1=argminβ1{0+(IH2)(yX1β1)22+λβ11}(*)=argminβ1{(IH2)y(IH2)X1β122+λβ11},
β2X2X2β^1

表記が少し一般的であるにもかかわらず、投げ縄を使用したことがあるほとんど誰もがこの結果に精通しています。これを確認するために、が切片を表すの(長さ)ベクトルであると仮定します。次に、射影行列、および任意のベクトルに対して、正射影は、ベクター。方程式考えると、これはまさにラッソ係数を計算するときに行うことです!それらは切片を考慮する必要がないようにデータを降格します。X2=1nH2=1(1T1)11T=1n11Tv(IH2)v=vv¯1()


7

そのようなアプローチの背後には多くの「理論」が必要であることを知らない。ペナルティ付き回帰アプローチ(LASSO、リッジ、またはそれらのハイブリッドエラスティックネット回帰)は、モデルの一般化可能性とパフォーマンスを改善するためにバイアス分散のトレードオフを行うためのツールです。を提案するように、いくつかの変数にペナルティを課さないようにすることもできますが、他の変数にはペナルティが課されます。たとえば、このペーパーでは、リッジ回帰L2ペナルティを持つ他の共変量を組み込んで、ワクチン接種のステータスをペナルティなしに保つことにより、ワクチンの有効性を検討しました。このアプローチは、共変量の過剰適合を回避しながら、関心のある主要な予測子を直接評価できるようにしました。β2

特定のプログラミング環境での実装に関する質問は、このサイトではトピックから外れています。R のglmnetパッケージのように、この問題に取り組む一般的な方法の1つは、目的関数を評価する前に、全体的な選択を乗算する予測子固有のペナルティファクターを含めることです。予測子のデフォルトのペナルティファクターは1ですが、指定されたペナルティファクターが0の予測子にはまったくペナルティが適用されず、無限のペナルティファクターを持つ予測子は常に除外されます。予測子間で異なるペナルティファクターの中間値は、予測子間で任意の望ましい差分ペナルティを提供できます。このアプローチは、によって提供されるツールに何らかの形で組み込むことができると思います。λsklearn


2
1通常以来 1がの効果取り除くことができように見える、指定されたが、いくつかの他の手段では見られないに(回帰することにより、に対する、フィット)と応答などと調整などを回帰子、およびのみを回帰子として使用して残差に対して投げ縄を実行します。の解の空間は同じになりますが、パラメータ(重要ではない)定数が乗算される場合があります。リッジ回帰の回避策はさらに簡単です。λX1X2X2X1β2YX2X1β1λ
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.