混合効果モデル(lme4)からのケースの勾配の抽出


12

次の段落で概説するように、混合効果モデルで各個人の勾配を抽出したい

混合効果モデルを使用して、年齢、性別、教育年数を固定効果として含む認知サマリー測定値の個々の変化の経路を特徴付けました(Laird and Ware、1982; Wilson et al。、2000、2002c)... 。年齢、性別、教育の影響を調整した後、混合モデルから個々の認知低下勾配の残存用語を抽出しました。次に、個人固有の調整された残差勾配が、遺伝的関連分析の定量的結果表現型として使用されました。これらの推定値は、個人の傾斜と、同じ年齢、性別、教育レベルの個人の予測傾斜との差に相当します。

De Jager、PL、Shulman、JM、Chibnik、LB、Keenan、BT、Raj、T.、Wilson、RSなど (2012)。加齢に伴う認知機能低下の割合に影響を与える一般的なバリアントのゲノムワイドスキャン。老化の神経生物学、33(5)、1017.e1〜1017.e15。

coef関数を使用して各個人の係数を抽出することを検討しましたが、これが使用する正しいアプローチであるかどうかはわかりません。

誰でもこれを行う方法に関するアドバイスを提供できますか?

#example R code 
library(lme4)
attach(sleepstudy)  
fml <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)
beta <- coef(fml)$Subject
colnames(beta) <- c("Intercept", "Slope")
beta

summary(beta)
summary(fm1)

回答:


28

モデル:

library(lme4)
data(sleepstudy)
fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)

この関数coefは、個人差を抽出するための適切なアプローチです。

> coef(fm1)$Subject
    (Intercept)       Days
308    253.6637 19.6662581
309    211.0065  1.8475834
310    212.4449  5.0184067
330    275.0956  5.6529540
331    273.6653  7.3973908
332    260.4446 10.1951151
333    268.2455 10.2436611
334    244.1725 11.5418622
335    251.0714 -0.2848735
337    286.2955 19.0955694
349    226.1950 11.6407008
350    238.3351 17.0814915
351    255.9829  7.4520286
352    272.2687 14.0032989
369    254.6806 11.3395025
370    225.7922 15.2897513
371    252.2121  9.4791308
372    263.7196 11.7513155

これらの値は、固定効果と分散成分(ランダム効果)の組み合わせです。summaryおよびcoefを使用して、固定効果の係数を取得できます。

> coef(summary(fm1))[ , "Estimate"]
(Intercept)        Days 
  251.40510    10.46729 

切片は251.4で、勾配(に関連付けられているDays)は10.4です。これらの係数は、すべての被験者の平均です。ランダム効果を取得するには、を使用できますranef

> ranef(fm1)$Subject
    (Intercept)        Days
308   2.2585637   9.1989722
309 -40.3985802  -8.6197026
310 -38.9602496  -5.4488792
330  23.6905025  -4.8143320
331  22.2602062  -3.0698952
332   9.0395271  -0.2721709
333  16.8404333  -0.2236248
334  -7.2325803   1.0745763
335  -0.3336936 -10.7521594
337  34.8903534   8.6282835
349 -25.2101138   1.1734148
350 -13.0699598   6.6142055
351   4.5778364  -3.0152574
352  20.8635944   3.5360130
369   3.2754532   0.8722166
370 -25.6128737   4.8224653
371   0.8070401  -0.9881551
372  12.3145406   1.2840295

これらの値は、被験者の分散コンポーネントです。すべての行は1つの主題に対応します。値は固定効果に関連する差異に対応するため、本質的に各列の平均はゼロです。

> colMeans(ranef(fm1)$Subject)
  (Intercept)          Days 
 4.092529e-13 -2.000283e-13 

これらの値はゼロに等しく、偏差は浮動小数点数表現の不正確さに起因することに注意してください。

coef(fm1)$Subject固定効果をランダム効果に組み込む結果、つまり、固定効果係数がランダム効果に追加されます。結果は、個々の切片と勾配です。


個々の係数の計算方法が明確になった回答をありがとう。ただし、上記の段落で残差の調整が行われたと述べられている場合、これは係数にランダム効果を含めることと同じですか、それとも別の問題ですか?
アンドリュース14年

coef(summary(fm1))[、 "Estimate"]はすべての被験者の平均を生成すると述べています。インターセプトが「反応」の平均値であることを暗示しているが、 'mean(sleepstudy $ Reaction)= 298.5079'です。これは線形回帰の切片の解釈であり、混合効果モデルの係数を理解しようとしていますが、物を得るのに苦労しています(このように加算します)。インターセプトが298.5ではないのはなぜですか?
-svannoy

@svannoy すべての共変量がゼロに等しい場合、切片は従属変数の推定値であることに注意してください。ここで、Daysは平均を中心にしていないため、モデルの切片はの平均値よりも低くなりますReaction。さらに、回帰直線は最適な線形フィットです。したがって、観測は必ずしもこの行にあるとは限りません。
スベンホーエンシュタイン

@SvenHohenstein、ありがとうございます。1つのカテゴリ予測変数と偏差コーディング(contr.sum())のみを使用したOLS回帰では、切片は正確に総平均であると言えますか?一方、ランダムインターセプトモデルを使用したRC回帰では、インターセプトは推定総平均値ですか?
svannoy

@svannoyはい、偏差コーディングでは切片はOLS回帰の大平均を反映します。線形混合モデルでは、切片は実際に推定される平均値です。
スヴェン・ホーエンシュタイン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.