LASSO(glmnet)を使用して、60以上の変数(連続およびカテゴリーの両方)で連続予測子を回帰しています。
変数トレースプロットを調べると、対数ラムダが増加すると、主要な変数の1つに実際に増加する係数があることがわかります。その後、ある時点を過ぎると、予想したように減少し始めます。
これがまぐれでないことを確認するために、私はブートストラップを使用して10モデルを実行し、非常に類似した結果を得ました。
これは可能ですか、それともデータに問題がありますか?正当な場合、変数の係数のこの傾向は、変数と応答との関係について何を教えてくれますか?