lmerでのランダム効果の指定方法に関する質問


55

最近、単語が異なるコンテキストで表示されたときのERP(EEG)を測定することにより、新しい単語の意味が繰り返しの露出(練習:1日目から10日目)で獲得される方法を測定しました。また、コンテキストのプロパティも制御しました。たとえば、新しい単語の意味の発見に対する有用性(高対低)。特に練習の効果(日数)に興味があります。個々のERP記録はノイズが多いため、ERPコンポーネントの値は、特定の条件の試行を平均することによって取得されます。このlmer関数では、次の式を適用しました。

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

そして

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

また、私は次のランダム効果と同等のものを文献で見ました。

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

フォームのランダム係数を使用して何が達成されparticipants:contextますか?行列代数の大まかな知識を持っている人に、線形混合モデルでランダムファクターが何をするか、そしてそれらをどのように選択するかを正確に理解させる良いソースはありますか?

回答:


77

lmer()フィットへの各呼び出しのモデルとそれらの違いを説明し、ランダム効果の選択に関する最終的な質問に答えます。

あなたの三つのモデルは、それぞれのための固定効果を含んでpracticecontext両者の間の相互作用。ランダム効果はモデル間で異なります。

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

に同じ値を持つ個人が共有するランダムな切片が含まれますparticipants。つまり、それぞれparticipantの回帰直線は、平均がランダムな量だけ上下にシフトされ。0

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

このモデルは、ランダムな切片に加えて、にランダムな勾配も含みますpractice。これは、個人が練習から学ぶ割合が人によって異なることを意味します。個人が正のランダム効果を持っている場合、平均よりも練習で急速に増加しますが、負のランダム効果は、ランダムの分散に応じて、練習よりも学習が平均よりも遅く、またはおそらく練習で悪化することを示します効果(これは練習の固定効果がプラスであると仮定しています)。

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

このモデルは、前のモデルと同様に、ランダムな勾配とインターセプトに適合しpracticeます(インターセプト(practice-1|...)を抑制するために行う必要があります)が、ファクターparticipants:contextにランダムな勾配とインターセプトも追加しました。レベルのすべての組合せが中に存在するparticipantscontext、対応するランダムな効果が両方の同じ値を有する観察によって共有されているparticipantscontext。このモデルに適合するためには、両方participantsとに対して同じ値を持つ複数の観測値が必要です。contextまたは、モデルは推定できません。多くの場合、この相互作用変数によって作成されたグループは非常にまばらであり、ランダム効果モデルを適合させるのに非常にノイズが多い/困難になるため、相互作用因子をグループ化変数として使用する場合は注意が必要です。

グループ化変数がデータセット内の不均一性の「ポケット」を定義する場合、またはグループ化因子のレベルを共有する個人が相互に相関する必要があると考えられる場合、基本的に(読み取り:複雑すぎず)ランダム効果を使用する必要があります相関させるべきではない個人)-ランダム効果はこれを達成します。両方のレベルを共有し、2つの部分の合計よりも類似participantsしてcontextいる観測を考える場合、「相互作用」ランダム効果を含めることが適切な場合があります。

編集: @Henrikがコメントで言及しているように、あなたが適合するモデル、例えば:

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base)

ランダムな勾配とランダムな切片が互いに相関し、その相関がモデルによって推定されるようにします。ランダムな勾配とランダムな切片が無相関になるようにモデルを制約するには(したがって、これらは正規分布しているため独立しています)、代わりにモデルを近似します。

lmer(ERPindex ~ practice*context + (1|participants) + (practice-1|participants), 
     data=base)

これら2つの間の選択は、たとえば、participant平均よりも高いベースライン(つまり、正のランダムインターセプト)が平均よりも高い変化率(つまり、正のランダムスロープ)を持つ可能性が高いと考えるかどうかに基づいている必要があります。その場合、2つの相関関係を許可しますが、そうでない場合は、それらが独立するように制約します。(繰り返しますが、この例では固定効果の勾配が正であると仮定しています)。


2
私はうるさくありませんが、2番目のモデルには切片と勾配の間の相関関係も含まれていません。スロープを追加するだけlmer(ERPindex ~ practice*context + (1|participants) + (0 + practice|participants, data=base)です:または私は間違っていますか?(無関係:投稿の私の小さな編集をすみません。説明に同意できない場合は、元に戻してください)
ヘンリック

@Henrik、はい、それは2つのランダム効果間の相関も推定するのは正しいです。この答えを書いているとき、私はこれらのモデルで何が起こっているのかについて「全体像」のアイデアを与えようとしていました。勾配とインターセプトの方法:)いずれの場合でも、この省略により、答えで行った解釈が不正確になるとは思わない。ところで、編集してくれてありがとう。
マクロ

1
@Henrik、ランダム効果を相関させるか、無相関にするかの違いについてメモを追加しました。これは答えを改善すると思います-それを指摘してくれてありがとう。
マクロ

ありがとう。私は混合モデリングの問題に取り組み、どのランダム効果構造をいつどのように使用するかという問題にも取り組んでいます。要するに、素晴らしい答え(+1)。
ヘンリック

1
@pom、お世辞に感謝します。再:あなたのコメント、私はシミュレートされたデータでこれをテストしました、そしてあなたはそれを後方に持っていると思います。編集中の2番目のモデルには、最初のモデルより1つ少ないパラメーターがあります。これは、2番目のモデルが2つのランダム効果間の相関をゼロに制約するためです。それ以外は、モデルは同じです。何が発生しているのかわかりませんが、再現可能な例が役立ちます。私のものは次のとおりですx <-rnorm(1000); id <- rep(1:100,each=10); y <- rnorm(1000); g <- lmer(y ~ (1+x|id)); g2 <- lmer(y ~ (1|id) + (x-1|id)); attr(logLik(g),"df"); attr(logLik(g2),"df");
。–マクロ

13

ここで@Macroが良い答えを出しました。1つだけ小さなポイントを追加したいと思います。あなたの状況の一部の人々が使用している場合:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

私は彼らが間違いを犯していると思う。検討は:(practice|participants)の効果のためにランダム傾斜(および切片)が存在することを意味practiceそれぞれについてparticipant、一方(practice|participants:context)の効果のためにランダム傾斜(および切片)が存在することを意味しpractice、それぞれのためにparticipant by context 組み合わせ。彼らが望んでいるのであればこれは問題ありませんが、私は彼らが望ん(practice:context|participants)でいると思うので、それぞれのの相互作用効果にランダムな勾配(および切片)があることを意味しpractice by contextますparticipant


4

ランダム効果または混合効果モデルでは、効果の確率分布から引き出されたように観察した効果を処理する場合に、ランダム効果が使用されます。

私が挙げることができる最良の例の1つは、多施設共同臨床試験から臨床試験データをモデル化するときです。サイト効果は、多くの場合、ランダム効果としてモデル化されます。これは、実際にトライアルで使用された20ほどのサイトが、より大きな潜在的なサイトのグループから引き出されたために行われました。実際には、選択はランダムではなかったかもしれませんが、あたかもそれがそうであったかのように扱うことは依然として有用かもしれません。

サイト効果は固定効果としてモデル化できましたが、20のサイトの異なる選択セットの効果が異なるという事実を考慮しない場合、結果をより大きな母集団に一般化することは困難です。ランダム効果として扱うことで、そのように説明することができます。


1
-1。この答えは実際の質問をここでは扱っていないためです。
アメーバは、モニカを復活させる
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.