Rでのlmer / lme混合モデルの仮定の確認


25

3つの異なるタスクで30人の男性と30人の女性をテストする繰り返しデザインを実行しました。男性と女性の行動がどのように異なり、それがタスクにどのように依存するかを理解したいと思います。これを調査するためにlmerとlme4の両方のパッケージを使用しましたが、いずれかの方法の仮定を確認しようとしています。私が実行するコードは

lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)

相互作用のない単純なモデルと比較し、anovaを実行して、相互作用が最良のモデルであるかどうかを確認しました。

lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)

Q1:これらのカテゴリカル予測子を線形混合モデルで使用しても大丈夫ですか?
Q2:結果変数(「振る舞い」)がそれ自体(性別/タスク間)自体に正規分布する必要はないことを正しく理解していますか?
Q3:分散の均一性を確認するにはどうすればよいですか?単純な線形モデルでは、を使用しますplot(LM$fitted.values,rstandard(LM))plot(reside(lm.base1))十分に使用していますか?
Q4:正常性を確認するには、次のコードを使用しますか?

hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)

私が気づいたことの一つは...最新のものではなかったので、簡単なプロット(myModel.lm)は仕事をしませんでした、おそらくこれは知っている他の読者のために有用であるlme4私のバージョンを使用していたこともある
crazjo

回答:


26

Q1:はい-回帰モデルと同じです。

Q2:一般的な線形モデルと同様に、結果変数は単変量変数として正規分布する必要はありません。ただし、LMEモデルは、モデルの残差が正規分布していることを前提としています。したがって、モデルへの変換または重みの追加は、これを処理する方法です(もちろん、診断プロットで確認します)。

Q3: plot(myModel.lme)

Q4: qqnorm(myModel.lme, ~ranef(., level=2))。このコードを使用すると、ランダム効果の各レベルのQQプロットを作成できます。LMEモデルは、クラスター内の残差が正規分布しているだけでなく、ランダム効果の各レベルも同様に分布していると想定しています。ヴァリlevelから0、1、あなたはラット、タスク、および被験者内の残差を確認することができるように2へ。

編集:また、正規性が想定されており、変換により非正常エラー/ランダム効果の問題を軽減できる可能性が高いことを追加する必要がありますが、すべての問題が実際に解決されているか、バイアスが導入されていないかは明らかではありません。データに変換が必要な場合は、変量効果の推定に注意してください。これに対処する論文があります。


ご回答有難うございます。出力を含む分析用のデータセットとスクリプトを共有して、実際に正しいかどうかを確認したいと思います。スタック交換で可能ですか?さらに、間違ったランダム係数(1 | rat / task)を実行したと思いますが、それは(1 | rat)だけではないでしょうか?3つのタスクで60ラット(各性別30匹)をテストしました。
crazjo

9
最近Q4のコードを試しましたが、サブセット化できないタイプ 'S4'のオブジェクトに関するエラーが発生しました。そのコードは、lmeパッケージに適合するモデル向けのものでしたか?lme4についてはどうですか?
emudrak 14

Q4に関して、これらのプロットを作成する人々は、生成される各プロットのNが合計よりも大幅に小さくなるため、プロットの変動が大きくなることに留意する必要があります。それらが全体として一貫して正規分布しているとは思わないでください。
ジョン

14

あなたは、マルチレベルモデルを取り巻く仮定についてかなり誤解しているようです。データの分散が均一であるという仮定はありません。残差はほぼ正規分布しているだけです。そして、カテゴリー予測子は常に回帰で使用されます(ANOVAを実行するRの基礎となる関数は線形回帰コマンドです)。

仮定の検証の詳細については、Pinheiro and Batesの本(p。174、セクション4.3.1)を参照してください。また、lme4(この本は書かれていません)を使用する予定がある場合は、lmerモデル(?plot.merMod)を使用してプロットを複製できます。

すぐに正常性を確認するには、それだけですqqnorm(resid(myModel))


コメントありがとうございます。lme4メソッドではなくlmerを使用することをお勧めしますか?そして、応答変数が正規分布する必要がないことを理解するのは正しいですか?Pinheiro and Batesの本を適切に読みます。
crazjo

また、複数の要素が機能する混合モデルでqqnorm(resid(myModel))を実行していますか?
crazjo

新しいlmer関数には、より多くの機能とより高いパフォーマンスがあります。qqnormを試しましたか?本の冒頭の読み方に関するアドバイスに従ってください。
ジョン

当初、lmerの最新バージョンが実際にはなかったためか、最初は奇妙に見えました。これに注意してくれてありがとう、今は必要に応じて動作します。
crazjo

12

Q2について:

Pinheiro and Batesの本によると、次のアプローチを使用できます。

「このlme関数は、weights引数を介してエラー内グループの不均一分散のモデリングを可能にします。このトピックについては、5.2で詳しく説明しますが、現時点では、 varIdent分散関数構造により、因子であり、異分散モデルに適合するために使用できます[...] "

ピンヘイロとベイツ、p。177

等しい分散を確認しsexたい場合は、このアプローチを使用できます。

plot( lm.base2, resid(., type = "p") ~ fitted(.) | sex,
  id = 0.05, adj = -0.3 )

分散が異なる場合は、次の方法でモデルを更新できます。

lm.base2u <- update( lm.base2, weights = varIdent(form = ~ 1 | sex) )
summary(lm.base2u)

さらにrobustlmm、計量アプローチを使用するパッケージを見ることができます。この概念に関する Kollerの博士論文は、オープンアクセスとして利用できます(「線形混合モデルのロバスト推定」)。要約状態:

「新しいスケール推定、設計適応スケール推定は、後続のロバストテストの健全な基盤を提供することを目的として開発されました。残差の自然な不均一分散性を等しくし、スケール自体のロバスト推定方程式を調整することにより行います。 。これらの設計適応補正は、観測の数が推定されるパラメーターの数の5倍以下であるような小さなサンプル設定では重要です。」



コメントするのに十分なポイントがありません。ただし、上記の@Johnの回答のいくつかの側面を明確にする必要があると思います。ピンヘイロとベイツは、p。174:

仮定1-グループ内誤差は独立しており、平均ゼロと分散σ2で同一に正規分布し、それらはランダムな影響から独立しています。

この声明は同質の分散については確かに明確ではなく、私はLMEの概念の背後にあるすべての数学を知るための統計について十分に深くはありません。ただし、p。175、§4.3.1、彼らが書いた仮定1を扱うセクション:

このセクションでは、グループ内エラーが正規分布し、ゼロを中心とし、一定の分散を持っているという仮定を評価する方法に集中します。

また、次の例では、「一定の分散」が実際に重要です。したがって、pに「同一の正規分布」を記述したときに、それらが同種の分散を意味するかどうかを推測できます。174より直接に対処することなく。


-6

Q1:はい、なぜですか?

Q2:要件は、エラーが正規分布していることだと思います。

Q3:たとえば、リーベンのテストでテストできます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.