これはより概念的な質問ですが、私が使用するR
ときはのパッケージを参照しますR
。予測の目的で線形モデルを適合させることを目的としていて、変量効果が利用できない可能性がある場合に予測を行う場合、混合効果モデルを使用するメリットはありますか、それとも代わりに固定効果モデルを使用する必要がありますか?
たとえば、他の情報を使用して体重と身長のデータがあり、を使用して次のモデルを作成したlme4
場合、subjectはレベルの因子()です。
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
次に、新しい身長と年齢のデータを使用して、モデルから体重を予測できるようにしたいと考えています。明らかに、元のデータの被験者ごとの分散がモデルに取り込まれますが、この情報を予測に使用することは可能ですか?新しい身長と年齢のデータがあり、体重を予測したい場合は、次のようにして行います。
predict(mod1,newdata=newdf) # newdf columns for height, age, subject
これが使用されますpredict.merMod
、と私はどちらか(新しい)の被験者のための列含むことができnewdf
、またはセットをre.form =~0
。最初の例では、モデルが「新しい」主題因子をどのように処理するかが明確ではありません。2番目の例では、モデルでキャプチャされた主題別の分散は、予測に対して単に無視(平均)されますか?
どちらの場合でも、固定効果の線形モデルの方が適しているように思えます。実際、私の理解が正しければ、変量効果が予測に使用されない場合、固定効果モデルは混合モデルと同じ値を予測するはずです。これは事実でしょうか?それR
ではありません、例えば:
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject
異なる結果が得られます。
mod2 <- lm(weight ~ height + age, data=df)
predict(mod2,newdata=newdf) # newdf columns for height, age