と間のLASSO関係


10

LASSO回帰についての私の理解は、最小化問題を解決するために回帰係数が選択されることです。

minβyXβ22 s.t.β1t

実際には、これはラグランジュ乗数を使用して行われ、問題を解決します

minβyXβ22+λβ1

λtの関係は何tですか?ウィキペディアは、それが「データに依存する」と単純に述べているが役に立たない。

なぜ気にするのですか?まずは知的好奇心。しかし、交差検証によって\ lambdaを選択した場合の結果についても心配していλます。

具体的には、n分割交差検証を行っている場合、トレーニングデータのn個の異なるパーティションにn個の異なるモデルを適合させます。次に、指定された\ lambdaの未使用データの各モデルの精度を比較しますλ。ただし、同じ\ lambdaは、データの異なるサブセットに対してλ異なる制約(t)を意味します(つまり、t=f(λ)は「データ依存」です)。

最良のバイアス精度のトレードオフを与えるtを見つけるために本当に解決したい相互検証問題ではないtですか?

実際にこの効果のサイズの大まかなアイデアを得るには、各交差分割とに対してを計算し、結果の分布を確認します。場合によっては、暗黙の制約()が交差検証サブセット全体で大幅に変化することがあります。ここで実質的に私は変動係数を意味し。β1λtt>>0


5
説明されていない反対投票を取り消すための賛成投票。質問は私の専門知識の外ですが、それは合理的に定式化されているようです。
mkt-モニカを2017年

回答:


2

これはリッジ回帰の標準的な解決策です

β=(XX+λI)1Xy

また、なので、それは真でなければなりませんβ=t

(XX+λI)1Xy=t

を解くのは簡単ではありません。λ

あなたの最善の策は、あなたがしていることをそのまま続けることです:複数の値にわたってデータの同じサブサンプルでを計算します。tλ

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.