混合効果モデルと固定効果モデルの比較(変量効果の有意性のテスト)


10

正の連続であると、およびカテゴリカルであるの3つの変数を考えるyx、次のz2つの候補モデルが与えられます。

fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )

そして

fit.fe <- lm( y ~ 1 + x )

これらのモデルを比較して、どちらのモデルがより適切かを判断したいと思います。ある意味fit.feで内にネストされているように思えますfit.me。通常、この一般的なシナリオが当てはまる場合、カイ2乗検定を実行できます。ではR、次のコマンドでこのテストを実行できます。

anova(fit.fe,fit.me)

両方のモデルに(パッケージlmerから生成されたlme4)ランダム効果が含まれている場合、anova()コマンドは正常に機能します。境界パラメーターがあるため、通常は、結果として得られるカイ2乗統計量をシミュレーションでテストすることをお勧めします。それでも、シミュレーション手順で統計量を使用できます。

両方のモデルに固定効果のみが含まれている場合、このアプローチ---および関連するanova()コマンド---はうまく機能します。

ただし、上記のシナリオのように、1つのモデルにランダム効果が含まれ、削減モデルに固定効果のみが含まれる場合、anova()コマンドは機能しません。

具体的には、次のエラーが発生します。

 > anova(fit.fe, fit.me)
 Error: $ operator not defined for this S4 class

上から(シミュレーションで)カイ二乗アプローチを使用することに問題はありますか?あるいは、これは単に、anova()さまざまな関数によって生成された線形モデルを処理する方法を知らないという問題ですか?

言い換えれば、モデルから導出されたカイ2乗統計量を手動で生成することが適切でしょうか?もしそうなら、これらのモデルを比較するための適切な自由度は何ですか?私の計算で:

F=((SSEreducedSSEfull)/(pk))((SSEfull)/(np1))Fpk,np1

固定効果モデルの2つのパラメーター(勾配と切片)と混合効果モデルのさらに2つのパラメーター(ランダムな勾配とランダムな切片の分散パラメーター)を推定しています。通常、切片パラメーターは自由度の計算ではカウントされないため、およびであることを意味します。変量効果パラメーターの分散パラメーターを自由度の計算に含める必要があるかどうかはわかりませんが、固定効果パラメータの分散推定値は考慮されませんが、固定効果のパラメータ推定値は未知の定数であると想定され、未知の確率変数であると見なされるためと考えられますp = k + 2 = 3k=1p=k+2=3混合効果のため。この問題についていくつかの支援をお願いします。

最後に、誰かがRこれらのモデルを比較するためのより適切な(- ベースの)ソリューションを持っていますか?


4
あなたが交換した場合lm()gls()からnlmeパッケージ、およびlmer()lme()(再びからnlmeパッケージ)、すべてが正常に動作します。ただし、より単純なモデルのパラメーターはパラメーター空間の境界にあるため、保守的なテスト(p値が大きすぎる)になることに注意してください。そして実際には、変量効果を含めるかどうかの選択は、統計的検定ではなく、理論(たとえば、サンプリング計画)に基づく必要があります。
Karl Ove Hufthammer 2015年

1
モデルで何をしたいですか?ある目的には1つのモデルの方が優れ、他の目的には他のモデルの方が優れている場合があります。すべてのモデルが間違っているので、問題はどちらのモデルが正しいかではなく、特定の問題に対してより有用です。
コディオロジスト2015年

1
@Kodiologist基本的に、固定効果のパラメーター推定値が信頼できることを確認したいと思います。観測値が独立していると想定されている場合、標準誤差は信頼できない可能性があります。さらに、変量効果がどのように変数であるかについていくらか発言するのは良いことですが、これはそれほど本質的ではないと思います。
user9171 2015年

2
@ user9171モデルのパラメーター推定値の安定性(信頼性)を確認する良い方法は、ブートストラップを使用することです。2つのモデルが共有する各パラメーターのブートストラップ分布をグラフ化します。パラメーターとモデルごとに1つのグラフがあります。分布が狭いほど、安定性が高くなります。パラメータが少ないほど各パラメータのより正確な推定が可能になるため、より単純なモデルがより安定した推定をもたらすことがわかります。
コディオロジスト2015年

回答:


6

技術的には、パラメーターの順序を切り替えるだけで機能します。

> anova(fit.me, fit.fe) 

うまくいきます。lmer最初に生成されたオブジェクトを渡すと、anova.merMod代わりにが呼び出されますanova.lmlmerオブジェクトの処理方法がわかりません)。見る:

?anova.merMod

ただし、混合モデルまたは固定モデルの選択は、モデル選択の問題ではなく、実験計画を考慮に入れる必要があるモデリングの選択です。詳細については、@ BenBolkerのhttps://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#testing-significance-of-random-effectsを参照してください。

変量効果の重要性をテストしないことを検討してください。


+1。私は自由に、@ BenBolkerのFAQへのリンクを挿入しました。このリンクには、いくつかの詳細な説明と参照が含まれています。
アメーバはモニカを復活させる '
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.