Lassoの単純な劣勾配法ではなく、なぜ近位勾配降下法なのですか?


9

ラッソをバニラ劣勾配法で解こうと考えていました。しかし、私は近位勾配降下法の使用を提案する人々を読みました。Lassoでバニラ劣勾配法の代わりに近位GDを使用する理由を誰かが強調できますか?

回答:


13

確かに、部分勾配法を使用して投げ縄の近似解を見つけることができます。たとえば、次の損失関数を最小化したいとします。

f(w;λ)=yXw22+λw1

ペナルティ項の勾配は、 λ ために wi<0 そして λ ために wi>0、しかしペナルティ用語は以下では区別できない 0。代わりに、劣勾配を使用できますλsgn(w)、これは同じですが、値は 0 ために wi=0

損失関数に対応する劣勾配は次のとおりです。

g(w;λ)=2XT(yXw)+λsgn(w)

勾配降下と同様のアプローチを使用して損失関数を最小限に抑えることができますが、劣勾配(これは、0、グラデーションは未定義です)。解は真のラッソ解に非常に近い可能性がありますが、正確なゼロが含まれていない可能性があります-重みがゼロである必要がある場合、代わりに非常に小さな値をとります。この真のスパース性の欠如は、投げ縄に劣勾配法を使用しない理由の1つです。専用ソルバーは、問題の構造を利用して、計算効率の高い方法で真にスパースなソリューションを生成します。この投稿によると、スパースソリューションの作成に加えて、専用メソッド(近接勾配法を含む)は、劣勾配法よりも収束速度が速いとのことです。彼はいくつかの参照を与えます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.