追加の入れ子構造を持つ反復測定データに対してRで線形混合モデルを指定することに関する質問


10

データ構造

> str(data)
 'data.frame':   6138 obs. of  10 variables:
 $ RT     : int  484 391 422 516 563 531 406 500 516 578 ...
 $ ASCORE : num  5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
 $ HSCORE : num  6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
 $ MVMNT  : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
 $ STIM   : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
 $ DRUG   : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
 $ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
 $ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ TRIAL  : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...

完全なモデル候補

model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
                              + (1|PATIENT) + (1|SESSION), data, REML = TRUE)
  • 試験の反応時間はセッション内でクラスター化され、セッションは患者内でクラスター化されます
  • 各トライアルは、ASCOREとHSCOREの2つの連続共変量(1〜9の範囲)と移動応答(撤回またはアプローチ)によって特徴付けることができます。
  • セッションは、薬物摂取量(プラセボまたはアクティブファーマコン)と満腹感(絶食または事前摂食)によって特徴付けられます。

モデリングとR構文?

トップダウンモデル選択戦略の開始点として使用できる、ロードされた平均構造を持つ適切なフルモデルを指定しようとしています。

特定の問題:

  • 構文はクラスタリングと変量効果を正しく指定していますか?
  • 構文を超えて、このモデルは上記のサブジェクト内設計に適していますか?
  • 完全なモデルでは、固定効果のすべての相互作用を指定する必要がありますか、それとも本当に関心のある相互作用のみを指定する必要がありますか?
  • トライアルで使用された特定の刺激タイプを特徴付けるSTIMファクターをモデルに含めていませんが、推定には興味がありません-ランダムファクターとして指定する必要があります。刺激タイプごとのデータポイント?

ここでアドバイスが見つからない場合、誰に質問すればいいのか本当にわかりませんか?多分あなたは専用の混合モデルフォーラムを知っていますか?
Cel

3
こんにちは@Celさん、5方向、4方向、3方向の相互作用を含め、モデルにすべての相互作用があるようです。このケースについてはよくわかりませんが、通常はデータが大幅に過剰になり、結果の一般化が難しくなります。後方選択(使用する必要がある場合)は、完全に飽和したモデルから始める必要はありません。もっともらしいモデルから始める必要があります。あなたはそれをまったく減らすことができますか?
マクロ

@Macro知ってよかった。そのときもっともらしいと思われる相互作用のみを含める。他の問題に関する提案はありますか?もしそうなら、多分それを答えとして入れて、私はそれを受け入れることができます。
チェル

回答:


16

私はあなたの質問のそれぞれに順番に答えます。

構文はクラスタリングと変量効果を正しく指定していますか?

ここで適合したモデルは、数学的にはモデルです

Yijk=Xijkβ+ηi+θij+εijk

どこ

  • Yijkkji

  • Xijkkji

  • ηiiθijijεijk

  • β

14-15ページに記載されているようにこのモデルは、セッションが個人内にネストされることを指定するのに適しています。これは、説明からそうです。

構文を超えて、このモデルは上記のサブジェクト内設計に適していますか?

Xijkβ

完全なモデルでは、固定効果のすべての相互作用を指定する必要がありますか、それとも本当に関心のある相互作用のみを指定する必要がありますか?

このように大幅に飽和したモデルから始めることは、実質的に意味がない限り、良い考えではないかもしれません。コメントで述べたように、これは特定のデータセットを過剰に適合させる傾向があり、結果の汎用性が低くなる可能性があります。モデルの選択に関しては、完全に飽和したモデルから始めて後方選択を行う場合(このサイトの一部の人は、正当な理由により、に反対します)、モデルの階層尊重する必要があります。つまり、モデルから低レベルの相互作用を排除する場合は、その変数を含むすべての高レベルの相互作用も削除する必要があります。これについての詳細は、リンクされたスレッドを参照してください。

トライアルで使用された特定の刺激タイプを特徴付けるSTIMファクターをモデルに含めていませんが、推定には興味がありません-ランダムファクターとして指定する必要があります。刺激タイプごとのデータポイント?

確かにアプリケーションについて何も知らないので(これを一粒の塩で考えてください)、ランダムな効果ではなく、固定効果のように聞こえます。つまり、治療タイプは、平均応答の固定シフトに対応する変数のように聞こえますが、同じ刺激タイプの被験者間の相関を誘発するものではありません。しかし、それが123レベルの要素であるという事実は、モデルに入るのを面倒にします。これがどれほどの効果を期待できるか知りたいと思います。効果のサイズに関係なく、これは線形モデルであるため、勾配推定にバイアスは生じませんが、除外すると、標準誤差が他の場合よりも大きくなる場合があります。


2
ワオ。マクロありがとう、もっとポイントをあげたいです。
チェル

ηiθjθj
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.