LARSアルゴリズムからのLASSO正則化パラメーター


9

彼らの独創的な論文'Least Angle Regression'で、Efron は、完全なLASSO正則化パスを計算できるようにするLARSアルゴリズムの簡単な修正について説明しています。

私はこのバリアントを正常に実装し、通常、出力パスをステップ数(LARSアルゴリズムの連続反復)または回帰係数のノルム()ます。l1β1

それでも、そこにあるほとんどのパッケージは、LASSOペナルティ係数観点から正則化パスを提供しているようです(たとえば、「mode」引数を使用してさまざまな表現を切り替えることができるLARSのLARS)。λ

私の質問は、ある表現から別の表現に切り替えるために使用されるメカニズムは何ですか?私はそれに関連するさまざまな質問を見てきました(より具体的には、不等式制約を適切なペナルティ用語)。満足のいく答えは見つかりませんでした。λ β 1β1tλβ1


[編集]

必要な変換を実行するいくつかのMATLABコードの内部を調べました。各LARSステップ、これは計算方法のようです。λkλ

λ(k)=max(2|XTy|),   for k=1
λ(k)=median(2|XAkTrAk|),   k>1

ここで、X(サイズn×p)およびy(サイズn×1)は標準化された入力/応答を表し、Akはステップkでのアクティブな予測子のセットを表し、rはステップkkでの現在の回帰残差を表しますrk

その計算の背後にある論理を理解できません。誰か助けてもらえますか?

回答:


4

必要な変換を実行する方法を理解しました。

入力が標準化され(ゼロ平均、単位分散)、応答が中央にあるとます。Xy

修正されたLARSアルゴリズムは、完全なLASSO正規化パスを提供することを知っています(cf. エフロン他によるオリジナル論文。

つまり、各反復で、前のアルゴリズムは、正規化された損失関数を最小化する最適なカップルを見つけます: k(β,λ)

(β,λ)=argmin(β,λ)L(β,λ)L(β,λ)=yXβ22+λβ1=i=1N(yij=1pβjXij)2+λj=1p|βj|

ステップの終わりにアクティブセットすべてのアクティブコンポーネント、KTT定常性条件を適用すると、 a={1,...,q}Akk

0=Lβa(β,λ)=2i=1NXia(yij=1qβjXij)+λ sign(βa)

つまり、 または行列表記(による除算/乗算は同じです)では、アクティブなコンポーネントについて次の方程式が満たされます

λ=2i=1NXia(yij=1qβjXij)sign(βa)
sign(x)a
λ=2 sign(βa)XaTr

元の論文では、著者はLASSO問題のあらゆる解決策について、アクティブな回帰重み()の符号は、対応するアクティブな予測子と現在の回帰残差(との相関の符号と同一であるべきであると述べています)、は正でなければならないため、これは単なる論理です。したがって、次のように書くこともできます。βaXaTrλ

λ=2|XaTr|

さらに、最後のステップ(OLSフィット、)では、直交性補題によりことがわかります。私が見つけたMATLAB実装での中央値の使用は、すべてのアクティブなコンポーネントの数値エラーを「平均化」するための取り組みのようです。kβ=(XTX)1XTyλ=0

λ=median(2|XAkTrAk|),   k>1

アクティブなコンポーネントがない場合(ステップ)にの値を計算するには、上記と同じトリックを使用できますが、すべての回帰重みがゼロであり、最初のコンポーネント符号のみがアクティブ(ステップ)が重要です。これにより、λk=1bk=2

λ=2 sign(βb)XbTy
これは完全に同等です

λ=max(2|XTy|), for k=1

(i)回帰重みの符号に関する前述と同じ発言; (ii)LARSアルゴリズムは、アクティブセットに入る次のコンポーネントを、現在の残差と最も相関があるものとして決定します。これは、ステップで単にです。bk=1y


2
これは、すべてのLASSOの作業で言及されているものですが、誰もそれを説明する必要はありません(それが非常に基本的なものかどうかはわかりませんが、理解するのに長い時間がかかりました)。「同等」ではありますが、最適化の問題を解決して最適な重みを設定すると、1つの定式から別の定式に(制約付きから制約なしに、またはその逆に)移行できることを強調しておきます。
skd

2
私は同じように感じます!あなたの発言に関する限り、確かにそうです。ここで、これは残差に反映されます。これは 、ステップ終わりに最適な回帰重みが取得された後にのみ計算できます。rAkβkk
Quantuple
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.