正則化された回帰(Ridge、LASSO、Elastic Net)とそれらの制約式の間には同等性があると述べられています。
私も見てきましたクロス検証済み1、およびクロス検証済み2、私は明確な答え等価ショーやロジックを見ることができません。
私の質問は
Karush–Kuhn–Tucker(KKT)を使用してその同等性を示す方法は?
次の式はリッジ回帰用です。
注意
この質問は宿題ではありません。このトピックの理解を深めるだけです。
更新
私はまだアイデアを思いつきません。
正則化された回帰(Ridge、LASSO、Elastic Net)とそれらの制約式の間には同等性があると述べられています。
私も見てきましたクロス検証済み1、およびクロス検証済み2、私は明確な答え等価ショーやロジックを見ることができません。
私の質問は
Karush–Kuhn–Tucker(KKT)を使用してその同等性を示す方法は?
次の式はリッジ回帰用です。
注意
この質問は宿題ではありません。このトピックの理解を深めるだけです。
更新
私はまだアイデアを思いつきません。
回答:
より技術的な答えは、制約付き最適化問題はラグランジュ乗数に関して記述できるためです。特に、制約付き最適化問題に関連するラグランジアンは、によって与えられます。
ここで、は問題の制約を満たすように選択された乗数です。したがって、この最適化問題の1次条件(適切な凸関数を使用しているので十分です)は、ラグランジュをに関して微分することで取得できます。
ただし、これらの最適化問題では一般に、制約付き最適化問題のレンズを通して、または制約なし問題のレンズを通して問題を考えることがしばしば可能である理由を理解することは有用だと思います。より具体的には、次の形式の制約のない最適化問題があると仮定します。
常にこの最適化を直接解決しようとすることができますが、この問題を次のように分解することは意味があるかもしれませんサブコンポーネント。特に、であることを確認するのは難しくありません
したがって、固定値の
編集:要求に応じて、リッジ回帰のより具体的な分析を含めます。これは、LASSOペナルティの微分不可能性に関連する専門性に対処する必要がないように、主要なアイデアをキャプチャするためです。思い出してください(マトリックス表記で)最適化問題を解決しています:
してみましょう OLS溶液(すなわち何の制約がない場合)こと。次に、の場合に焦点を当てます (これが存在する場合)それ以外の場合、拘束はバインドされないため興味をそそられません。この問題のラグランジアンは、と書くことができます
次に微分すると、1次条件が得られます:
これは線形方程式のシステムであり、したがって解くことができます:
素晴らしい分析があるstats_modelでの彼の答えが。
私はリッジ回帰の等価式の証明で同様の質問に答えてみました。
このケースでは、より実践的なアプローチを採用します。2つのモデルのと
間のマッピングを見てみましょう。
私が書いたから見ることができstats_modelに彼の分析マッピングは、データに依存します。したがって、問題の具体的な実現方法を選択します。しかし、コードとソリューションのスケッチは、何が起こっているかを直感的に追加します。
次の2つのモデルを比較します。
が正則化モデルの解であり、が制約付きモデルの解であると仮定しましょう。
ようなからへのマッピングを調べています。
上で見て私の解決策へのノーム制約最小二乗のためのソルバー 1は、正則モデルを解決し、発見制約モデルが含ま解くことを見ることができました一致した(実際のコードがで提示されたユークリッド(最小二乗)ノルム制約)。
したがって、同じソルバーを実行し、ごとに最適な表示します。
ソルバーは基本的に以下を解決します:
だからここに私たちのマトリックスがあります:
mA =
-0.0716 0.2384 -0.6963 -0.0359
0.5794 -0.9141 0.3674 1.6489
-0.1485 -0.0049 0.3248 -1.7484
0.5391 -0.4839 -0.5446 -0.8117
0.0023 0.0434 0.5681 0.7776
0.6104 -0.9808 0.6951 -1.1300
そしてここに私たちのベクトルがあります:
vB =
0.7087
-1.2776
0.0753
1.1536
1.2268
1.5418
これはマッピングです:
上記からわかるように、の十分に高い値では、期待どおりにパラメーターです。
[0、10]の範囲にズームイン:
完全なコードは、私のStackExchange Cross Validated Q401212 GitHubリポジトリで入手できます。