予測にランダム効果を含めずに、混合効果モデルから予測するのはなぜですか?


10

これはより概念的な質問ですが、私が使用するRときはのパッケージを参照しますR。予測の目的で線形モデルを適合させることを目的としていて、変量効果が利用できない可能性がある場合に予測を行う場合、混合効果モデルを使用するメリットはありますか、それとも代わりに固定効果モデルを使用する必要がありますか?

たとえば、他の情報を使用して体重と身長のデータがあり、を使用して次のモデルを作成したlme4場合、subjectはレベルの因子()です。nn=no.samples

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

次に、新しい身長と年齢のデータを使用して、モデルから体重を予測できるようにしたいと考えています。明らかに、元のデータの被験者ごとの分散がモデルに取り込まれますが、この情報を予測に使用することは可能ですか?新しい身長と年齢のデータがあり、体重を予測したい場合は、次のようにして行います。

predict(mod1,newdata=newdf) # newdf columns for height, age, subject

これが使用されますpredict.merMod、と私はどちらか(新しい)の被験者のための列含むことができnewdf、またはセットをre.form =~0。最初の例では、モデルが「新しい」主題因子をどのように処理するかが明確ではありません。2番目の例では、モデルでキャプチャされた主題別の分散は、予測に対して単に無視(平均)されますか?

どちらの場合でも、固定効果の線形モデルの方が適しているように思えます。実際、私の理解が正しければ、変量効果が予測に使用されない場合、固定効果モデルは混合モデルと同じ値を予測するはずです。これは事実でしょうか?それRではありません、例えば:

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject

異なる結果が得られます。

mod2 <- lm(weight ~ height + age, data=df)

predict(mod2,newdata=newdf) # newdf columns for height, age



1
推定に含まれていなかった新しいグループを予測したいと思うかもしれません
kjetil b halvorsen 2017

はい、しかしその場合、なぜ混合効果モデルに悩むのでしょうか。予測の変量効果を無視した場合、固定効果モデルが機能しないのは何ですか?
tribalsoul 2017

1
まあ、それはあなたがエラー構造のより良い(より正確な)モデルを持っているので、より良い推定量を与えるかもしれません
kjetil b halvorsen

回答:


5

簡単な思考実験:出産後の乳児5名の体重と身長を測定しました。2年後、同じ赤ちゃんからもう一度測定しました。その間、赤ちゃんの娘の体重と身長をほぼ毎週測定し、100組の値をもたらしました。混合効果モデルを使用する場合、問題はありません。固定効果モデルを使用する場合は、娘からの測定値に過度の重みを付け、娘からのデータのみを使用した場合とほぼ同じモデルフィットが得られるようにします。したがって、反復測定や不確実性構造を正しくモデル化することは、推論にとって重要であるだけでなく、予測にとっても重要です。一般に、混合効果モデルと固定効果モデル(違反した仮定)から同じ予測を取得することはありません。

そしてnewdfに(新しい)主題の列を含めることができます

元の(トレーニング)データの一部ではなかった被験者を予測することはできません。再び思考実験:新しい主題は肥満です。モデルが変量効果分布の上限であることをモデルはどのようにして知ることができますか?

モデルで取得された被験者別の分散は、予測では単に無視されます(平均されます)。

私があなたを正しく理解していれば、はい。モデルは母集団の期待値の推定値を提供します(この推定値は元の被験者を条件とすることに注意してください)。


1
明確な説明と例をありがとう、これはすべて理にかなっています。しかし、あなたが述べるところYou can't predict for subjects which were not part of the original (training) data; re.form=~0人口期待値から設定して予測することで、それだけを行うことができませんか?確かに、モデルは予測に被験者固有の情報を使用していませんが、混合効果モデルからの推定は、被験者固有の変動があった同等の固定効果モデルからの推定よりも正確であると言っても差し支えありません。無視?
tribalsoul 2017

1
固定モデルは、その仮定に違反するため、適用できません。依存構造を含むモデルを使用する必要があります。re.form=~0人口レベルの予測が得られます。これは、新しい被験者に対して行うことができる最善の方法です。
ローランド

glmmLasso Rでパッケージを使用するときにも同じ質問がありました。パッケージの作成者であるAndreas Grollは、glmmLassoプロシージャは、固定効果のみを使用して新しい対象の予測を行い、既存の対象の固定+ランダム効果を次の期間に使用すると述べました。
RobertF
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.