LASSO問題の係数を取得したい
問題は、glmnet関数とlars関数が異なる答えを与えることです。glmnet関数については、係数を求めます。| Y | | 単にλの代わりに、私はまだ異なる答えを得る。
これは予想されますか?ラースとの関係は何であるとglmnet λは?私はglmnetがLASSOの問題に対してより高速であることを理解していますが、どの方法がより強力かを知りたいですか?
deps_statsデータセットのサイズが大きすぎてLARSが処理できないのに対して、glmnetは大きなデータセットを処理できません。
mpiktas(Y-Xb)^ 2 + L \ sum | b_j |の解を見つけたい しかし、2つのアルゴリズム(larsとglmnet)から特定のLの計算された係数を求めると、異なる答えが得られます...そして、それは正しい/期待されているのでしょうか?または、2つの関数に間違ったラムダを使用しています。
glmnet
、LARSの実装からではなく、おそらくLARS実装からの単一のラムダソリューションを要求するべきではありません。バイアスと分散のスペクトルに沿った幅広いソリューションを提供します。これにより、実際の係数の比較が難しくなります。それでも、同じ変数はおそらく同様の順序でゼロ以外になるはずです。