LASSOの自由度の直観


12

ゾウ他 「なげなわの「自由度」」(2007)は、非ゼロ係数の数がなげなわの自由度の公平で一貫した推定値であることを示しています。

それは私には少し直感に反しているようです。

  • 回帰モデルがあると仮定します(変数は平均がゼロです)。

y=βバツ+ε
  • 無制限のOLS推定値がます。これは、非常に低いペナルティ強度に対する LASSO推定値とほぼ一致する可能性があります。ββ^OLS=0.5β
  • さらに、特定のペナルティ強度 LASSO推定値がます。たとえば、は、クロス検証を使用して見つかったデータセットの「最適な」になります。 λβ^LASSOλ=0.4λλ
  • 正しく理解すれば、どちらの場合も1つの非ゼロ回帰係数があるため、どちらの場合も自由度は1です。

質問:

  • はよりもフィッティングの「自由」が少ないことを示唆しているのに、どちらの場合も自由度は同じなのでしょうか? β OLS=0.5β^LASSOλ=0.4β^OLS=0.5

参照:


1
素晴らしい質問です、それはもっと注目に値するでしょう!
マティフォー

回答:


8

我々は一連の与えられていると仮定しP次元観察、X IRの Pを私は= 1 ... N。フォームのモデルを仮定: Yは、iが = β X I+ ε ここで、ε N 0 σ 2β R P、及び内積を表します。してみましょうn pバツRp=1n

Y=βバツ+ϵ
ϵN0σ2βRpは、フィッティング手法δ(目的に応じてOLSまたはLASSOのいずれか)を使用したβの推定値です。物品(式1.2)で与えられる自由度のための式は、 DF β= N Σ iが= 1 CovをβX IY Iをβ^=δ{Y}=1nβδ
dfβ^==1nCovβ^バツYσ2

この式を調べることにより、あなたの直感に従って、LASSOの真の DOFは実際にOLSの真の DOF より小さいと推測できます。LASSOの影響を受ける係数収縮は、共分散を減少させる傾向があります。

さて、あなたの質問に答えるために、あなたの例でLASSOのDOFがOLSのDOFと同じである理由は、モデルからサンプリングされた特定のデータセットから得られた推定値(バイアスのない推定値)を扱っているからです、真のDOF値。特定のデータセットの場合、そのような推定値は真の値と等しくなりません(特に、推定値は整数である必要がありますが、真の値は一般に実数です)。

λ


1
β^LASSO=0<1=1

ところで、なぜ自由度の推定値は整数である必要があるのですか?本当に?また、内積表記は不必要に複雑であり、このサイトではめったに使用されないことに注意してください。マトリックス表記で十分です。もちろん、それはあなたの選択です。
リチャードハーディ

1
はい、その合計について。推定が非ゼロ係数の数であるという理由だけで、自由度の推定値はLASSOの整数でなければなりません(少なくとも1つのデータセットの場合)。
e2crawfo

1
ステートメント自由度の推定値は、推定値が非ゼロ係数の数であるという理由だけでLASSOの整数でなければなりません。一般に、あなたが書いたdfの定義そのものから、dfは整数である必要はないと思います。同様に、尾根の場合、必ずしもゼロではありません。
マティフォー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.