LASSO回帰の問題の2つの同等の定式化、およびが与えられ、がどのように表現できるかと 1対1対応?
LASSO回帰の問題の2つの同等の定式化、およびが与えられ、がどのように表現できるかと 1対1対応?
回答:
あなたの質問への答えは、ラグランジュの双対性を考慮した結果です。これは、OPの投稿へのコメントで重複していると考える投稿で機能します。以下では、より洞察に富んだ派生物であると判断したものを計算します。
なげなわを解くとき、実際には、とを一緒に最小化しようとしています。つまり、を求めます。これらの2つの目的の間にはある程度の緊張があることがわかっているため、これは現時点では十分に定義されていないようです。これは、最適化担当者がマルチクライテリア最適化と呼ぶものです。多くのに対してをプロットして、この問題を視覚化しましょう。(注、ここで、、はランダムに初期化され、真の係数 エントリのおよそ4分の1がゼロに等しいです。)
ここで、およびです。つまり、縦軸は適合性の欠如を測定し、横軸は係数のサイズを測定します。わかりやすくするために、画像の上部を切り取っていることに注意してください。
プロットの左下の点は、私たちが興味を持っているものです。これらは、両方のノルムが小さく、誤差が小さいの値に対応しています。実際、左下のポイントについては、同じフィットでサイズが小さいか、同じサイズでよりフィットするはありません。パレート最適点と呼ばれるこれらの点から選択するには、2つの目的であるフィットとサイズの相対的な重要性を決定する必要があります。これは、それぞれ制約なしまたは制約付きなげなわでのチューニングパラメーターまたはを思い出させます。以下では、上記のグラフに課せられたglmnetから計算されたLassoソリューションを緑色でプロットしています。
Lassoが正確にパレート最適点を見つけたことに注意してください。しかし、これは驚くべきことです!多次元の目的はどのようにして1次元の目的によって最適化されましたか?このプロセスはスカラー化と呼ばれます。重みを取り、問題両方の目的がここにある凸状の場合、このスカラー化された問題はすべてのパレート最適点を見つけます。
仮定すると、両方の目的が検討されていると仮定し、書き込みされ、、私たちはこれがちょうどであることを持っている投げ縄、通常の形式です。ラグランジュの双対性により、代わりに同等の問題解くことができるように、からの存在がわかりますここで。
解決しようとしていることをよりよく理解し、優れた視覚化を得たところで、今度はチューニングパラメーターと間の関係を見つけることに焦点を合わせましょう。
与えられた値に対して、拘束されたなげなわ推定は、上のプロットの緑の点の1つになります。方法見つけることができるので自分自身を固定している(は最小二乗係数)を使用して、フィットの欠如の可能な限り低い測定値が得られるまで下に移動します。つまり、上で見たように、はベクトル目的のスカラー化に対応するため、この時点での勾配に等しくなります。