なげなわペナルティが二重指数関数(ラプラス)事前に等しいのはなぜですか?


27

回帰パラメーターベクトルのLasso推定値は、各事前分布が二重指数分布(ラプラス分布とも呼ばれる)であるBの事後モードと同等であることを多くの参考文献で読みました。BBi

私はこれを証明しようとしましたが、誰かが詳細を具体化できますか?


@ user777今日はしばらくその本を手探りしていました。関連するものが見つかりませんでした。
Wintermute

回答:


30

シンプルレットのちょうど変数の1つの観測を検討するために、このような Yを| μ σ 2N μ σ 2Y

Y|μ,σ2N(μ,σ2),

と不適切な事前 F σ α 1 σ > 0μLaplace(λ)f(σ)1σ>0

その後の関節密度に比例し、 F Y μ σ 2 | λ α 1Y,μ,σ2

f(Y,μ,σ2|λ)1σexp((yμ)2σ2)×2λeλ|μ|.

ログを取ると伴わない用語廃棄ログF Y μ σ 2= - 1μ

logf(Y,μ,σ2)=1σ2yμ22λ|μ|.(1)

したがって、(1)の最大値は、MAP推定値となり、実際に我々 reparametrize後の投げ縄の問題ですλ~=λσ2

回帰への拡張は明らかです-置き換えるX βノーマル見込みで、そして上の事前設定βは、独立したラプラスのシーケンスであるλ のディストリビューション。μXββ(λ)


25

これは、LASSOが最適化する量を調べることで明らかです。

ための先行を取る平均ゼロといくつかの規模を持つ独立したラプラスしますτβiτ

したがって、p(β|τ)e12τi|βi|

データのモデルは、通常の回帰仮定されyiidN(Xβ,σ2)

f(y|X,β,σ2)(σ2)n/2exp(12σ2(yXβ)T(yXβ))

事後のログのマイナス2倍の形式になりました

k(σ2,τ,n,p)+ 1σ2(yXβ)T(yXβ)+1τi|βi|

λ=σ2/τ2log

k(σ2,λ,n,p)+ 1σ2[(yXβ)T(yXβ)+λi|βi|]

β

S=(yXβ)T(yXβ)+λi|βi|

β

σ2

β


1
λβ1λ|μ|μ=Xβ

2
β0Xβ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.