この質問は以前に聞いたことがありますが、回答がなかったので、もう一度尋ねるかもしれません。
なげなわペナルティをリグレッサの一部のサブセット、つまり目的関数に適用することに興味があります
なげなわは\ boldsymbol {\ beta} _1にのみ適用されますが、は再構築に関与します。
この背後にある理論はありますか?第二に、とにかくこれをsklearnで行うことはありますか?
この質問は以前に聞いたことがありますが、回答がなかったので、もう一度尋ねるかもしれません。
なげなわペナルティをリグレッサの一部のサブセット、つまり目的関数に適用することに興味があります
なげなわは\ boldsymbol {\ beta} _1にのみ適用されますが、は再構築に関与します。
この背後にある理論はありますか?第二に、とにかくこれをsklearnで行うことはありますか?
回答:
してみましょうの列空間への直交プロジェクターも。我々はそれを持っている ここで
これを最初の最適化問題に組み込むと、 これは通常の投げ縄計算ツールで評価できます。whuberが彼のコメントで示唆しているように、無制限の係数はのスパンをカバーできるため、評価するときにのスパンに直交する空間の部分のみが問題になるため、この結果は直観的。
表記が少し一般的であるにもかかわらず、投げ縄を使用したことがあるほとんど誰もがこの結果に精通しています。これを確認するために、が切片を表すの(長さ)ベクトルであると仮定します。次に、射影行列、および任意のベクトルに対して、正射影は、ベクター。方程式考えると、これはまさにラッソ係数を計算するときに行うことです!それらは切片を考慮する必要がないようにデータを降格します。
そのようなアプローチの背後には多くの「理論」が必要であることを知らない。ペナルティ付き回帰アプローチ(LASSO、リッジ、またはそれらのハイブリッドエラスティックネット回帰)は、モデルの一般化可能性とパフォーマンスを改善するためにバイアス分散のトレードオフを行うためのツールです。を提案するように、いくつかの変数にペナルティを課さないようにすることもできますが、他の変数にはペナルティが課されます。たとえば、このペーパーでは、リッジ回帰L2ペナルティを持つ他の共変量を組み込んで、ワクチン接種のステータスをペナルティなしに保つことにより、ワクチンの有効性を検討しました。このアプローチは、共変量の過剰適合を回避しながら、関心のある主要な予測子を直接評価できるようにしました。
特定のプログラミング環境での実装に関する質問は、このサイトではトピックから外れています。R のglmnet
パッケージのように、この問題に取り組む一般的な方法の1つは、目的関数を評価する前に、全体的な選択を乗算する予測子固有のペナルティファクターを含めることです。予測子のデフォルトのペナルティファクターは1ですが、指定されたペナルティファクターが0の予測子にはまったくペナルティが適用されず、無限のペナルティファクターを持つ予測子は常に除外されます。予測子間で異なるペナルティファクターの中間値は、予測子間で任意の望ましい差分ペナルティを提供できます。このアプローチは、によって提供されるツールに何らかの形で組み込むことができると思います。sklearn