R's lmerチートシート


160

このフォーラムでは、を使用してさまざまな階層モデルを指定する適切な方法について多くの議論が行われていますlmer

すべての情報を1か所にまとめるのは素晴らしいことだと思いました。開始するいくつかの質問:

  1. 複数のレベルを指定する方法。1つのグループがもう1つのグループ内にネストされている(1|group1:group2)場合:it または(1+group1|group2)
  2. (~1 + ....)and (1 | ...)(0 | ...)etcの違いは何ですか?
  3. グループレベルの相互作用を指定する方法

11
パッケージのマニュアルと3つのビネットは、CRANlme4
Henry

4
ダグは、と(G)LMMS及びRに書いている本のCRAN材料、講義スライドプラスドラフトの章に加えて、ありますlme4から入手できるR-フォージ
ギャビン・シンプソン

ベイツ他によるJSS論文のarXivバージョンへの直接リンク:lme4を使用した線形混合効果モデルのフィッティング(特にセクション2.2「混合モデル式の理解」)。Ben BolkerのFAQ の関連セクションも参照してください。
アメーバ

5
ほぼ間違いなく、で使用される言語lmerは統計的に一般的なものであり、プログラミングだけの問題ではありません。したがって、このスレッドを開いたままにしておくことに投票しています。
whuber

2
@whuber +1完全に同意します。
アメーバ

回答:


180

(〜1 + ....)と(1 | ...)と(0 | ...)などの違いは何ですか?

変量効果として扱われるカテゴリ変数V2、線形固定効果として扱われる連続変数V3によって予測される変数V1があるとします。lmer構文を使用した最も単純なモデル(M1)は次のとおりです。

V1 ~ (1|V2) + V3

このモデルは以下を推定します。

P1:グローバルインターセプト

P2: V2のランダム効果インターセプト(つまり、V2の各レベルに対して、そのレベルのインターセプトのグローバルインターセプトからの偏差)

P3: V3の効果(勾配)の単一のグローバル推定

次に複雑なモデル(M2)は次のとおりです。

V1 ~ (1|V2) + V3 + (0+V3|V2)

このモデルは、M1のすべてのパラメーターを推定しますが、さらに推定を行います:

P4: V2の各レベル内のV3の効果(より具体的には、特定のレベル内のV3効果がV3のグローバル効果から逸脱する程度) V2の

後者の制限は、最終的な最も複雑なモデル(M3)で緩和されます。

V1 ~ (1+V3|V2) + V3

切片偏差とV2のレベル内でのV3効果偏差との相関を可能にしながら、M2からのすべてのパラメーターが推定されます。したがって、M3では、追加のパラメーターが推定されます。

P5:インターセプト偏差とV2レベル間のV3偏差の相関

通常、M2やM3などのモデルペアが計算され、比較されて、固定効果(グローバルインターセプトを含む)間の相関の証拠が評価されます。

ここで、別の固定効果予測子V4を追加することを検討してください。モデル:

V1 ~ (1+V3*V4|V2) + V3*V4

推定する:

P1:グローバルインターセプト

P2: V3の影響に関する単一のグローバル推定

P3: V4の影響に関する単一のグローバル推定

P4: V3とV4の相互作用の単一のグローバル推定

P5: V2の各レベルでのP1からの切片の偏差

P6: V2の各レベルでのP2からのV3効果の偏差

P7: V2の各レベルでのP3からのV4効果の偏差

P8: V2の各レベルでのP4からのV3 ごとの相互作用の偏差

P9 V2のレベル全体でのP5P6の相関

P10 V2のレベル全体でのP5P7の相関

P11 V2のレベル全体でのP5P8の相関

P12 V2のレベル全体でのP6P7の相関

P13 V2のレベル間のP6P8の相関

P14 V2のレベル全体でのP7P8の相関

ふう、それはたくさんのパラメーターです!また、モデルによって推定された分散パラメーターをリストすることさえしませんでした。さらに、固定効果としてモデル化する2つを超えるレベルのカテゴリ変数がある場合、その変数の単一の効果ではなく、常にk-1の効果を推定します(kはレベルの数) 、それにより、モデルによってさらに推定されるパラメータの数が爆発します。


1
@マイク・ローレンス答えてくれてありがとう!3レベルモデルはどのように推定されますか?あるグループ化要因が別のグループ化要因内にネストされている場所

DBR、私はあなたがレベルが何であるかを知っているとは思わない。あなたはこれについて永遠に尋ねてきました。実際に実験デザインを詳述し、「レベル」の解釈を示す質問を作成します。
ジョン

3
DBRは階層のレベルを指していると思います。私が説明したのは、サブジェクト内にネストされた観測値を持つ2レベルの階層モデルであり、DBRは3レベルの階層について質問しています。効果、生徒が学校内にネストされています。そのような場合、学校レベルの偏差が最初に計算され、次に学校からの偏差が計算されると思います。
マイクローレンス

2
モデルをセットアップするために見たベストアンサー。上司がRでlmerを使用して何をしているのかを理解するための簡単なフレームワークを提供するのに役立ちました。
bfoste01

個人レベルに1つの独立変数(X)があり、グループレベルに1つの独立変数(Z)があるとします。両方とも連続変数です。モデルがあれば
Yj=γ00+γ10バツj+γ01Zj+γ11バツjZj+あなたは1jバツj+あなたは0j+ej
jjlmerY~X+Z+(1|group)+(0+X|Z)group

50

一般的なトリックは、別の答えで述べたように、式が形式に従うということdependent ~ independent | groupingです。これgroupingは一般にランダムファクターであり、グループ化せずに固定ファクターを含めることができ、固定ファクターなしで追加のランダムファクターを持つことができます(インターセプトのみのモデル)。A +因子間には、全く相互作用を示さない*相互作用を示しています。

ランダム要因については、3つの基本的なバリアントがあります。

  1. ランダム係数のみによる切片: (1 | random.factor)
  2. ランダム係数のみによる勾配: (0 + fixed.factor | random.factor)
  3. ランダム係数による切片と勾配: (1 + fixed.factor | random.factor)

バリアント3には、同じグループ内で、つまり同時に計算された勾配と切片があることに注意してください。傾きと切片を別々に計算する場合、つまり2つの間に相関関係がないと仮定する場合、4番目のバリアントが必要です。

  • インターセプトとスロープ、個別に、ランダム係数:(1 | random.factor) + (0 + fixed.factor | random.factor)。これを記述する別の方法は、ダブルバー表記法を使用することfixed.factor + (fixed.factor || random.factor)です。

この質問への別の回答には、注目すべき要約もあります。

数学を少し掘り下げて理解している場合、Bar et al。(2013)は、lmer表1で構文を非常にうまく要約しています。この論文は、心理言語データを扱って、その2つのランダムな効果があるSubjectItem

モデルと同等のlme4数式構文:

    • Ys=β0+β1バツ+es
    • なし(混合効果モデルではありません)
    • Ys=β0+S0s+β1バツ+es
    • Y ∼ X+(1∣Subject)
    • Ys=β0+S0s+β1+S1sバツ+es
    • Y ∼ X+(1 + X∣Subject)
    • Ys=β0+S0s+0+β1+S1sバツ+es
    • Y ∼ X+(1 + X∣Subject)+(1∣Item)
    • Ys=β0+S0s+0+β1バツ+es
    • Y ∼ X+(1∣Subject)+(1∣Item)
    • S0sS1s
    • Y ∼ X+(1∣Subject)+(0 + X∣ Subject)+(1∣Item)
    • Ys=β0+0+β1+S1sバツ+es
    • Y ∼ X+(0 + X∣Subject)+(1∣Item)

参照:

バール、デールJ、R。レヴィ、C。シェイパーズ、HJティリー(2013)。確認仮説検定のランダム効果構造:最大に保ちます。Journal of Memory and Language、68:255–278。


4
いいね ネストされた '/'ファクターと二重バー表記 '||'に関するより良い情報になる可能性があります
スカン

1
:シンボルはどうですか?
eastafri

1
@eastafri R(式)のどこでも同じこと-2つの変数間の相互作用を意味します。
リビウス

S0sS1s0S0sS1s独立していることは必ずしも真実ではない、したがって、より強力な声明であると。私は間違っていますか?
Muno

4

|シンボルは、混合方法でグループ化係数を示しています。

Pinheiro&Batesによると:

...この式は、応答と、可能な場合は一次共変量も指定します。として与えられます

response ~ primary | grouping

ここで、response応答のための表現であり、primary一次共変量のための表現であり、groupingグループ化因子の発現です。

混合メソッド分析の実行に使用するメソッドによってはR、分析でgroupedDataグループ化を使用できるようにするためにオブジェクトを作成する必要がある場合があります(nlmeパッケージを参照してくださいlme4。これは必要ないようです)。私はlmerあなたのデータがわからないので、あなたがあなたのモデルステートメントを指定した方法について話すことができません。ただし、(1|foo)モデルの行に複数の行があることは、私が見たこととは異なります。何をモデル化しようとしていますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.