REML対ML stepAIC


10

AICを使用して最適なモデルを選択した後、混合モデル分析を実行する方法に関する文献を調べようとしたところ、私は圧倒されました。私のデータはそれほど複雑ではないと思いますが、私が行ったことが正しいことの確認を求めており、次に進む方法についてアドバイスします。lmeとlmerのどちらを使用する必要があるのか​​、またREMLとMLのどちらを使用する必要があるのか​​、どちらを使用するのかわかりません。

選択の値があり、どの共変量がその値に最も影響を与え、予測を可能にするかを知りたいです。以下は、私が作業しているテストのサンプルデータとコードの一部です。

ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)

私は、さまざまな組み合わせと最大2ウェイの相互作用項でこのデータを探索する最大19のモデルを持っていますが、常に変量効果としてIDを使用し、従属変数としてcomp1を使用しています。

  • Q1。どちらを使用しますか?lmeまたはlmer?それは重要ですか?

これらの両方で、MLまたはREMLを使用するオプションがあり、劇的に異なる答えが得られます-MLの後にAICを使用すると、6つのモデルがすべて同じAIC値で終わり、モデルの組み合わせは単に意味がありませんが、REML最も可能性の高いモデルの2つが最良の結果になります。ただし、REMLを実行すると、anovaを使用できなくなります。

  • Q2。ANOVAで使用するためにREMLよりもMLを使用する主な理由は何ですか?これは私には分かりません。

それでもstepAICを実行できないか、19のモデルを絞り込む別の方法がわかりません。

  • Q3。この時点でstepAICを使用する方法はありますか?

3
Q2では、固定効果が変化するとREMLを使用した比較が無効になるため、MLが必要です。考えられる有用な関連質問は次のとおり
アーロンがスタックオーバーフローを去りました

@Aaron以前にその質問を見たことがありますが、それでも混乱していました。REMLを使用して、ランダムな効果が変化したときにのみ「機能」しますか?私は明らかにMLとREMLを十分に理解していません。おかげで、それは私の質問の1つに役立ちます!
ケリー

はい、そうです。モデルを比較する場合、モデルに同じ固定効果がある場合にのみREMLを使用する必要があります。回答は以下に展開されています。
アーロンがスタックオーバーフローを去った

回答:


16

Q1。どちらを使用しますか?lmeまたはlmer?それは重要ですか? どちらでもかまいません。彼らはあなたに同じフィット感を与えます。 lmep値は得られますが、得られませlmerんが、ここでは説明しません。最も有名なリファレンスは、R-helpメーリングリストへのDoug Batesの投稿の1つです

(注意:それらはわずかに異なるアルゴリズムを使用するため、どちらかがより優れている可能性がある計算上困難なケースが潜在的に存在しますが、実際には非常にまれであり、実際には、おそらくある種のモデルの誤指定を指します。完全に異なるを参照してください。lmer()およびlme()の結果。)

Q2。ANOVAで使用するためにREMLよりもMLを使用する主な理由は何ですか?これは私には分かりません。 固定効果が変化するとREMLを使用した比較が無効になるため、MLが必要です。関連する可能性のある関連質問は、https//stats.stackexchange.com/a/16015/3601です。上記のコメントであなたの質問に答えるには、はい、モデルを比較するときは、モデルに同じ固定効果がある(つまり、ランダム効果のみが変化する)場合にのみREMLを使用する必要があります。REMLの可能性は、モデルに含まれる固定効果に依存するため、固定効果が変化しても比較できません。REMLは通常、変量効果をより適切に推定すると考えられているため、通常のアドバイスは、最終的な推論とレポートにREMLを使用して最良のモデルに適合させることです。

Q3。この時点でstepAICを使用する方法はありますか? 自分の状況で意味のある19のモデルを比較するには、すべてのモデルのAICを比較します。段階的な手順を使用する理由はまったくありません。ステップワイズ手順は、最良のモデルが見つかることを保証せず、コンピューターによって多くのモデルを簡単に比較できるため、最近では一般的に古くなっています。


1

さらに掘り下げてみると、Aaronが提供したリンクをバックアップするこれらのリソースも見つかりました。これは、私のように始めている人のための優れた資料です。例としてhttp://lme4.r-forge.r-project.org/にリンクされている章は、同じプロジェクトページのスライドリンクhttp://lme4.r-forge.r-project.org/slides/を確認してください。 。短いコースの多くには、Rコードの例も含まれています。これは非常に役立ちました。
また、ボルカー博士によるこの短い答えhttp://r.789695.n4.nabble.com/lme-vs-lmer-how-do-they-differ-td2534332.html

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.