統計学習で最も人気のある本を読みました
1- 統計学習の要素。
2- 統計学習の紹介。
どちらも、リッジ回帰には同等の2つの式があることに言及しています。この結果を理解できる数学的な証拠はありますか?
Cross Validatedも通過しましたが、そこには明確な証拠が見つかりません。
さらに、LASSOは同じタイプの証明を享受しますか?
統計学習で最も人気のある本を読みました
1- 統計学習の要素。
2- 統計学習の紹介。
どちらも、リッジ回帰には同等の2つの式があることに言及しています。この結果を理解できる数学的な証拠はありますか?
Cross Validatedも通過しましたが、そこには明確な証拠が見つかりません。
さらに、LASSOは同じタイプの証明を享受しますか?
回答:
古典的なリッジ回帰(Tikhonov正則化)は次のように与えられます:
上記の主張は、次の問題が同等であることです。
のは、定義しようXを第一の問題との最適解として〜X第二の問題の最適解として。
その等価手段の項。
つまり、あなたはいつものペアを持つことができますとの問題のようなソリューションが同じです。
どのようにしてペアを見つけることができますか?
さて、問題を解決し、ソリューションのプロパティを確認します。
どちらの問題も凸面で滑らかであるため、物事が簡単になるはずです。
最初の問題の解決策は、勾配が消える点で与えられます。
2番目の問題のKKT条件には次のように記載されています。
そして
最後の式は、または。
2つの基本方程式が同等であることに注意してください。
すなわち、もしX = 〜Xおよびμ = λ両方の式が成り立ちます。
それは、その場合の意味だから1本のマスト組のためにどの手段その両方一つの必須のセットと等価であるために十分な大きさ。
もう一方のケースでは、を見つける必要があります。
これは基本的に
が見つかると、ソリューションが衝突します。
(LASSO)の場合、まあ、それは同じ考え方で動作します。
唯一の違いは、解決のために閉じていないため、接続を導出するのが難しいことです。
StackExchange Cross Validated Q291962およびStackExchange Signal Processing Q21730- Basis Pursuit での重要性に関する私の回答をご覧ください。
備考
実際に何が起こっていますか?
どちらの問題でも、は可能な限り近づけようとします。
最初のケースでは、は最初の項(距離)を消滅させ、2番目のケースでは目的関数を消滅させます。
違いは、最初のケースでは、そのノルムの制約である壁にぶつかるまで、ノルムのバランスを取る必要があることです(tです。高く、バランス手段を取得し、あなたは確認する必要があり小さいです。
2番目の場合、壁があり、を yに近づけます)。
壁が十分に大きく(高い値)、十分にのノルムに依存する場合、iには意味がありませんがその値にのノルムを掛けたものだけが意味を持つようになります。
正確な接続は、上記のラグランジアンによるものです。
今日この論文を見つけました(2019年3月4日):
何が起こっているのかを理解するための数学的に厳密ではないが、おそらくより直感的なアプローチは、制約バージョン(問題の式3.42)から開始し、「Lagrange Multiplier」(https://en.wikipedia .org / wiki / Lagrange_multiplierまたはお気に入りの多変数計算テキスト)。計算ではは変数のベクトルですが、この場合はxは定数であり、は変数ベクトルであることに注意してください。あなたは(離れて余分を投げた後、最初の方程式(3.41)で終わるラグランジュ乗数法適用たら- λ トン最小化に対して一定であり、無視することができます)。
これはまた、投げ縄やその他の制約に対して機能することを示しています。
ラグランジュ双対性と、より広い関係(場合によっては同等)について読むことはおそらく価値があります:
2つの変数の関数があるとします。どんなについてのxとyの、我々は持っています:
それはいずれかのために保持しているため、XとYそれはまた成り立ちます。
これは弱い双対性として知られています。特定の状況では、強力な二重性もあります(サドルポイントプロパティとも呼ばれます)。
強力な双対性が成り立つ場合、双対問題を解くことで主問題も解決します。ある意味、同じ問題です!
関数を次のように定義します。
ハード制約を受けるリッジ回帰問題は次のとおりです。
あなたは選ぶ後にすることを目的、認識し最小限に抑えるためにBが選ばれ、相手が設定されますλあなたが選択した場合は無限にbのようにΣのp個のJ = 1、B 2 、J > トンを。
強い双対性が保持されている場合( Slaterの条件が満たされているためにここで行われます)、順序を逆にすることで同じ結果が得られます。
ここでは、相手が最初に選択します!次に、bを選択して目的を最小化します。既にλの選択がわかっています。分Bの L(B、λ )(とら部分λを所与として)あなたのリッジ回帰問題の第2形態に相当します。
ご覧のとおり、これはリッジ回帰特有の結果ではありません。それはより広い概念です。
(Rockafellarから読んだ博覧会の後にこの投稿を始めました。)
Rockafellar、RT、凸解析
それらは同等ではありません。
制約付き最小化問題の場合
対応するラグランジアンを最小化することにより解きます
ここで、外因的に与えられる結合され、λ ≥ 0は、 Karush-クーン・タッカー非負乗数であり、そして 両方のベータベクトルとλは最小化手順によって最適に決定される所与のT。
OPの投稿でとeq (3.41 )を比較すると、リッジ推定量は次の解として得られるようです。
であるので関数は、制約付き最小化問題に加え伴わない用語のラグランジュのように見えるが最小化されるbは、確かに二つのアプローチが等価であるように思われます...
しかし、これは正しくありません。リッジ回帰では、λ > 0が与えられると、を最小化します。しかし、制約付き最小化問題のレンズでは、仮定λを> 0課した制約が結合した状態、すなわち、その
一般的な制約付き最小化問題では、も許可され、基本的には、特別な場合として基本最小二乗推定器(λ ∗ = 0)およびリッジ推定器(λ ∗ > 0)を含む定式化です。
したがって、2つの定式化は同等ではありません。それでも、Matthew Gunnの投稿は、2つが非常に密接に関連していることを別の非常に直感的な方法で示しています。しかし、二重性は等価ではありません。