正則化手法とは、投げ縄、尾根回帰、弾性網などを指します。
入院患者の滞在期間が予測される人口統計データと診断データを含むヘルスケアデータの予測モデルを考えてみましょう。一部の個人では、相関するベースライン期間中に複数のLOS観測(つまり、複数のIPエピソード)があります。
たとえば、各個人の変量効果切片項を含むエラスティックネット予測モデルを構築することには意味がありますか?
正則化手法とは、投げ縄、尾根回帰、弾性網などを指します。
入院患者の滞在期間が予測される人口統計データと診断データを含むヘルスケアデータの予測モデルを考えてみましょう。一部の個人では、相関するベースライン期間中に複数のLOS観測(つまり、複数のIPエピソード)があります。
たとえば、各個人の変量効果切片項を含むエラスティックネット予測モデルを構築することには意味がありますか?
回答:
この問題を扱った論文がいくつかあります。私は特別な順序で検索しません。
Pen.LME:ハワードDボンデル、アルンクリシュナ、スジットKゴーシュ。線形混合効果モデルの固定効果とランダム効果のジョイント変数選択。Biometrics、66(4):1069-1077、2010。
GLMMLASSO:Jurg Schelldorfer、Peter Buhlmann、Sara van de Geer。L1ペナルティを使用した高次元線形混合効果モデルの推定。北欧統計ジャーナル、38(2):197-214、2011。
オンラインで見つけることができます。
私はたまたま、混合モデル(LMMEN)にエラスティックネットペナルティを適用することに関する論文を仕上げており、来月のジャーナルレビューのために送信する予定です。
全体として、通常ではない、またはIDリンクがないデータをモデル化している場合は、GLMMLASSOを使用します(ただし、REの多くを処理できないことに注意してください)。そうでなければ、Pen.LMEは、固定効果またはランダム効果のいずれであっても、相関性の高いデータがないことを考えると良いでしょう。後者の場合、私にメールを送っていただければ、コード/紙をお送りします(近い将来、クランに載せます)。
今日CRANにアップロードしました-lmmen。固定効果とランダム効果を同時に弾性ネットタイプのペナルティで線形混合モデル問題を解決します。
私は、リッジ回帰を、単一のカテゴリー変数に限定されない(そして派手な相関行列がない)単なる経験的変量効果モデルとして常に見ました。尾根ペナルティを相互検証し、単純なランダム効果をフィッティング/推定することで、ほぼ同じ予測を得ることができます。あなたの例では、派手になって、デモ/診断機能に別の尾根ペナルティを設定し、患者インジケータに別の尾根ペナルティを設定することができます(何かのペナルティスケーリング係数を使用してglmnet
)。あるいは、時間相関のある効果を人によってランダムに追加することもできます。これらの可能性はどれも正しいか間違っているのではなく、単に役立つだけです。