私は現在、約300の変数と800の観測値を持つデータセットのバイナリ結果の予測モデルの構築に取り組んでいます。このサイトでは、段階的回帰に関連する問題と、なぜそれを使用しないのかについて多くを読みました。
私はLASSOの回帰とその機能選択機能を読んでおり、「キャレット」パッケージと「glmnet」を使用してそれを実装することに成功しています。
私は最適で、モデルの係数を抽出することができるよlambda
とalpha
「キャレット」から。ただし、係数の解釈方法には慣れていません。
- LASSO係数はロジスティック回帰と同じ方法で解釈されますか?
- LASSOから選択した機能をロジスティック回帰で使用することは適切でしょうか?
編集
LASSO回帰の指数係数のように、他のすべての係数を一定に保ちながら係数の1単位の対数オッズが変化するときの係数の解釈。
「ロジスティック回帰と同じように解釈される」とはどういう意味ですか?あなたが一般化したい解釈を正確に知ることは非常に役に立ちます。
—
Matthew Drury
@Matthew Drury-私のコースはLASSOに行ったことがないので、時間を割いて手伝ってくれてありがとう。一般に、大学院で教えた内容から、ロジスティック回帰の指数係数は、他のすべての係数を一定に保ちながら、係数の1単位の増加の対数オッズを生成します。
—
Michael Luu
私の知る限り、ほとんどのLASSO実装では係数の有意性検定が導入されていません。つまり、OLSで統計的に有意な変数を決定できる一方で、選択された対応する変数のLASSO係数が考慮すべき「重要な」変数であるというより弱いステートメントを作成することを除いて、LASSOではそれができないという違いはないでしょうか?
—
godspeed