「混合モデル」の3つの形式の解釈


19

混合モデルで私をつまずかせている区別があり、私はそれを明確にすることができるかどうか疑問に思っています。カウントデータの混合モデルがあるとします。固定効果(A)と時間の別の変数(T)として必要なことがわかっている変数があり、「サイト」変数でグループ化されています。

私が理解したように:

glmer(counts ~ A + T, data=data, family="Poisson") 固定効果モデルです。

glmer(counts ~ (A + T | Site), data=data, family="Poisson") ランダム効果モデルです。

私の質問は次のようなものがあるときです。

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")Tとは?ランダム効果ですか?固定効果?Tを両方の場所に置くことで実際に何が達成されますか?

ときに何かがなければならない唯一のモデル式のランダムなエフェクト・セクションに表示されますか?

回答:


22

これは、これら3つのモデルのそれぞれについてモデル式を書き出すことにより、より明確になる可能性があります。レッツ人のために観察することがのサイト内のJ各モデルでと定義A_ {IJを}、T_ {IJ}モデル内の変数を参照することと同様。 i j A i jT i jYjjAjTj

glmer(counts ~ A + T, data=data, family="Poisson") モデルです

ログEYj=β0+β1Aj+β2Tj

これは通常のポアソン回帰モデルです。

glmer(counts ~ (A + T|Site), data=data, family="Poisson") モデルです

ログEYj=α0+ηj0+ηj1Aj+ηj2Tj

ここで、は、サイト個人が行った各観測で共有されるランダム効果です。。これらのランダム効果は、指定したモデルで自由に相関させることができます(つまり制限はありません)。独立性を課すには、それらを異なる括弧内に配置する必要があります。このモデルは、すべてのサイトでがしていますが、各サイトにはランダムオフセット()があり、。J Σ ログ E Y I J α 0 η jを0 A 、I 、JT I Jηj=ηj0ηj1ηj2N0ΣjΣ(A-1|Site) + (T-1|Site) + (1|Site)ログEYjα0ηj0AjTj

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") モデルです

ログEYj=θ0+γj0+θ1Aj+θ2+γj1Tj

したがって、は、固定効果によって与えられると何らかの「平均」関係をが、その関係はサイトごとに異なり、それらの違いはランダム効果によってキャプチャされます。つまり、ベースラインはランダムにシフトされ、2つの変数の勾配はランダムにシフトされ、同じサイトの全員が同じランダムシフトを共有します。ログEYjAjTjθ0θ1θ2γj0γj1γj2

Tとは?ランダム効果ですか?固定効果?Tを両方の場所に置くことで実際に何が達成されますか?

Tは共変量の1つです。ランダム効果ではありません- Siteランダム効果です。固定効果は、上記のモデルで-によって与えられるランダム効果に応じて異なります。このランダムな効果を含めることで達成されるのは、との関係でサイト間の不均一性を許容することです。TSiteγj1TログEYj

モデル式のランダム効果セクションにのみ表示されるのはいつですか?

これは、アプリケーションのコンテキストで意味をなすものの問題です。

インターセプトに関して-多くの理由でそこに固定インターセプトを保持する必要があります(たとえば、こちらを参照)。re:ランダム切片。これは主に、同じサイトで行われた観測間の相関を引き起こすように作用します。そのような相関が存在することが意味をなさない場合、ランダム効果を除外する必要があります。γj0

ランダム勾配に関して、ランダム勾配のみで固定勾配のないモデルは、各サイトについて、と各サイトの共変量の間に何らかの関係があるという信念を反映しています。 、しかし、すべてのサイトでそれらの効果を平均化する場合、関係はありません。たとえば、ランダムな勾配があり、一定の勾配がない場合、これは、平均して時間は影響を与えない(データに長期的な傾向がないなど)が、それぞれが時間とともにランダムな方向に向かっていると言うようなものです。理にかなっています。繰り返しますが、それはアプリケーションに依存します。ログEYjTSite

ランダム効果の有無に関係なくモデルを適合させて、これが起こっているかどうかを確認できることに注意してください。固定モデルでは効果が見られず、後続のモデルでは有意なランダム効果が見られます。このような決定は、多くの場合、モデルの選択よりもアプリケーションの理解に基づいて行われる方がよいことに注意する必要があります。


2
(+1):各モデルのモデル式を記述することは、R表記をより透明にする最良の方法です。よくやった!
ocram

@Macro上記の方程式に関する1つの質問(btwに感謝します)-通常のエラー用語も含まれていますか?もしそうなら、その用語の添え字は何ですか?
フォマイト

2
こんにちは-GLMを記述する1つの方法は、ここでやったように、(または「リンク」バージョン)のモデルとしてです。モデルが正しく指定されている場合、期待値にエラー項はありません。あなたの質問に答えるために、GLMでは分布を指定しています。線形モデルの「残り」のランダム性は、正規分布の誤差項によって明示されます。ただし、非線形GLM(ポアソン、ロジスティックなど)では、ポアソンの速度やベルヌーイ試行の成功確率を知ることでエラーなしに実現を予測することができないため、ランダム性が「組み込まれています」。お役に立てれば。EYj|バツYj|バツ
マクロ

11

Tモデルのランダム効果項ではなく、固定効果であることに注意してください。ランダム効果は|lmer式の後に表示される効果のみです!

このlmerのよくある質問で、この仕様の詳細について説明しています。

この質問から、モデルは次のようになります(固定効果のためT)。

  • グローバルスロープ
  • 各レベルの全体的な勾配からの偏差を指定するランダムな勾配項 Site
  • ランダムな勾配間の相関。

そして@ mark999が言ったように、これは確かに一般的な仕様です。反復測定の設計では、一般的に、反復測定(被験者内)のすべての因子に対して、ランダムな勾配と相関関係が必要です。

いくつかの例については、次のペーパーを参照してください(私は常にここで引用する傾向があります)。

Judd、CM、Westfall、J。、およびKenny、DA(2012)。社会心理学における刺激をランダムな要因として扱う:広範だが無視されている問題に対する新しく包括的な解決策。Journal of Personality and Social Psychology、103(1)、54–69。doi:10.1037 / a0028347


2
エコロジーからの同様の参照:Schielzeth、Holger、およびWolfgang Forstmeier。2009.「サポートを超えた結論:混合モデルでの自信過剰な見積もり。」行動生態学20(2)(3月1日):416–420。doi:10.1093 / beheco / arn145。beheco.oxfordjournals.org/content/20/2/416
ベンボルカー

1

パラメーター自体に特に関心がない場合でも、依存データを回避するためにそれを含める必要がある場合に、ランダムな部分にのみ何かが表示されます。たとえば、子がクラスにネストされている場合、通常は子をランダムな効果としてのみ使用します。


1
誤解しているかもしれませんが、同じ変数に固定効果とランダム効果を持たせることは、ランダム効果だけの変数よりも一般的だと思っていたでしょう。同じ変数に固定効果とランダム効果があることは、Pinheiro and Batesの本では珍しくありません。
mark999

2
私が理解する@MichaelChernick、同じ変数の固定効果とランダム効果がある場合、固定効果は母集団の全体的な効果であり、ランダム効果は各被験者の変数の異なる効果を許可します。Pinheiro&Batesにはいくつかの例があります。
mark999

2
@ PeterFlom、re:「子がクラスにネストされている場合、通常、子はランダムな効果としてのみ必要です。」クラスはランダムな効果だということだと思います。データにさらにネストが存在しない限り(子供の反復測定など)、子供レベルのランダム効果は特定されません。
マクロ

1
@macroはい、それは私が意味することです、ごめんなさい。用語は非常に紛らわしくなります!それが、ゲルマンが「固定」および「ランダム」という用語を使用しない理由かもしれません
ピーター・フロム-モニカの復職

2
@マイケル、私はあなたに同意します。これらの種類の階層モデルでは、ランダム効果はグループ化変数によって定義されます(「グループ化」変数が連続的に変化する空間インデックス付きデータセットなどの他の多変量モデルとは対照的)。OPの質問では、Siteランダム効果、ないとも呼ばれることになるTか、Aまたは何か他のもの。そのように考えると、Site「2つの効果は互いに識別されないため、明らかに効果を固定およびランダムの両方にすることはできません。変数には固定係数とランダム係数の両方を使用できますが、それは別の質問です。
マクロ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.