変量効果モデルで正則化手法を使用できますか(すべきですか?)


11

正則化手法とは、投げ縄、尾根回帰、弾性網などを指します。

入院患者の滞在期間が予測される人口統計データと診断データを含むヘルスケアデータの予測モデルを考えてみましょう。一部の個人では、相関するベースライン期間中に複数のLOS観測(つまり、複数のIPエピソード)があります。

たとえば、各個人の変量効果切片項を含むエラスティックネット予測モデルを構築することには意味がありますか?


あなたの最初の行のための字幕:「ランダム効果技術によって、私はラプラス事前分布と回帰パラメータの通常の事前確率を参照しています(つまり、パラメータがランダムに分布しているかについての仮定)...など」:-)
conjugateprior

回答:


7

この問題を扱った論文がいくつかあります。私は特別な順序で検索しません。

  1. Pen.LME:ハワードDボンデル、アルンクリシュナ、スジットKゴーシュ。線形混合効果モデルの固定効果とランダム効果のジョイント変数選択。Biometrics、66(4):1069-1077、2010。

  2. GLMMLASSO:Jurg Schelldorfer、Peter Buhlmann、Sara van de Geer。L1ペナルティを使用した高次元線形混合効果モデルの推定。北欧統計ジャーナル、38(2):197-214、2011。

オンラインで見つけることができます。

私はたまたま、混合モデル(LMMEN)にエラスティックネットペナルティを適用することに関する論文を仕上げており、来月のジャーナルレビューのために送信する予定です。

  1. LMMEN:Sidi、Ritov、Unger。Elastic Netペナルティによる線形混合モデルの正則化と分類

全体として、通常ではない、またはIDリンクがないデータをモデル化している場合は、GLMMLASSOを使用します(ただし、REの多くを処理できないことに注意してください)。そうでなければ、Pen.LMEは、固定効果またはランダム効果のいずれであっても、相関性の高いデータがないことを考えると良いでしょう。後者の場合、私にメールを送っていただければ、コード/紙をお送りします(近い将来、クランに載せます)。

今日CRANにアップロードしました-lmmen。固定効果とランダム効果を同時に弾性ネットタイプのペナルティで線形混合モデル問題を解決します。

パッケージには、lmmlassoおよびglmmLassoパッケージ用のcv関数も含まれています。


1
Yonicd、弾性混合網の線形混合モデルへの適用は、まさに私が探しているものです。私は相関している遺伝データを扱っているので、弾性ネットのグループ化された選択は非常に役に立ちます。私はあなたに連絡しようとしましたが、メッセージを送信することが不可能に思われるので、この返信を投稿する以外に方法はありません。とにかく、私はあなたの論文を読むのを楽しみにしており、利用可能になり次第コードを試してみます。

5

私は、リッジ回帰を、単一のカテゴリー変数に限定されない(そして派手な相関行列がない)単なる経験的変量効果モデルとして常に見ました。尾根ペナルティを相互検証し、単純なランダム効果をフィッティング/推定することで、ほぼ同じ予測を得ることができます。あなたの例では、派手になって、デモ/診断機能に別の尾根ペナルティを設定し、患者インジケータに別の尾根ペナルティを設定することができます(何かのペナルティスケーリング係数を使用してglmnet)。あるいは、時間相関のある効果を人によってランダムに追加することもできます。これらの可能性はどれも正しいか間違っているのではなく、単に役立つだけです。


2

私は現在、同様の質問について考えています。アプリケーションでは、それが機能し、これを使用することが合理的であると考えれば、それを実行できると思います。変量効果の通常の設定である場合(つまり、グループごとに測定を繰り返している場合)は、推定手法に関するものであり、議論の余地はあまりありません。ほとんどのグループで実際に多くの繰り返し測定を行わない場合、通常の変量効果モデルの境界線上にある可能性があり、一般的に提案する場合は(方法論の観点から)その妥当性を慎重に正当化することができます。方法。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.