閉じた形のなげなわソリューションの派生が正しくないのはなぜですか?


28

投げ縄問題には閉じた形式のソリューションがあります:\ beta_j ^ {\ text {lasso}} = \ mathrm {sgn}(\ beta ^ {\ text {LS}} _ j)(| \ beta_j ^ {\ text {LS }} |-\ alpha)^ + Xに正規直交列がある 場合。これは、このスレッドに示された:閉じた形投げ縄ソリューションの導出を

βlasso=argminβyXβ22+αβ1
βjlasso=sgn(βjLS)(|βjLS|α)+
X

ただし、一般に閉じた形式のソリューションがない理由はわかりません。亜微分を使用して、以下を取得しました。

Xn×p行列です)

f(β)=yXβ22+αβ1
=i=1n(yiXiβ)2+αj=1p|βj|
XiXの i番目の行ですX
=i=1nyi22i=1nyiXiβ+i=1nβTXiTXiβ+αj=1p|βj|
fβj=2i=1nyiXij+2i=1nXij2βj+βj(α|βj|)
={2i=1nyiXij+2i=1nXij2βj+α for βj>02i=1nyiXij+2i=1nXij2βjα for βj<0[2i=1nyiXijα,2i=1nyiXij+α] for βj=0
fβj=0我々 GET

βj={(2(i=1nyiXij)α)/2i=1nXij2for i=1nyiXij>α(2(i=1nyiXij)+α)/2i=1nXij2for i=1nyiXij<α0 for i=1nyiXij[α,α]

誰が私が間違った場所を見たのですか?

回答:

行列の観点から問題を書くと、X ^ TX = Iの正規直交の場合にのみ閉形式の解が存在する理由が非常に簡単にわかりますXTX=I

f(β)=yXβ22+αβ1
=yTy2βTXTy+βTXTXβ+αβ1
f(β)=2XTy+2XTXβ+(α|β1)
(ここで一度に多くのステップを踏んだ。しかし、この時点までは、これは最小二乗解の導出に完全に類似しています。したがって、そこに欠けているステップを見つけることができるはずです。)
fβj=2XjTy+2(XTX)jβ+βj(α|βj|)

fβj=0我々が得ます

2(XTX)jβ=2XjTyβj(α|βj|)
2(XTX)jjβj=2XjTyβj(α|βj|)2i=1,ijp(XTX)jiβi

これで、1つのに対するソリューションが他のすべての依存していることがわかりますしたがって、ここから先に進む方法は明確ではありません。が正規直交の場合、なるため、この場合は閉じた形式のソリューションが必ず存在します。βjβijX2(XTX)jβ=2(I)jβ=2βj

GuðmundurEinarssonの回答に感謝します。ここで詳しく説明します。今回は正しいことを願っています:-)


3
CrossValidatedへようこそ。非常に素晴らしい最初の投稿おめでとうございます!
S. Kolassa -復活モニカ

回答:


16

これは通常、最小角度回帰で行われますここで論文を見つけることができます。

最初は混乱して申し訳ありませんが、これをもう一度試してみます。

したがって、関数を展開すると、f(β)

f(β)=i=1nyi22i=1nyiXiβ+i=1nβTXiTXiβ+αj=1p|βj|

次に、に関して偏微分を計算します。私の懸念は、1-ノルムの前の最後の項、すなわち二次項の偏微分の計算です。さらに調べてみましょう。それがあります:βj

Xiβ=βTXiT=(β1Xi1+β2Xi2++βpXip)
したがって、2次項を本質的に次のように書き換えることができます。 さて、このWRTの導関数を計算するために連鎖法則を使用することができ:
i=1nβTXiTXiβ=i=1n(Xiβ)2
βj
βji=1n(Xiβ)2=i=1nβj(Xiβ)2=i=1n2(Xiβ)Xij

したがって、各方程式にはすべての係数が存在するため、問題はそれほど簡単に単純化されません。β

これは、なぜなげなわの閉じた形の解決策がないのかというあなたの質問には答えません。


1
どうもありがとう。閉じた形式のソリューションがない理由を実際に見ることができます(私の編集を参照)。
ノーバート

甘い!素晴らしい仕事:)
グメオ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.