被験者内の双方向設計からの次のデータを考慮してください。
df <- "http://personality-project.org/r/datasets/R.appendix4.data"
df <- read.table(df,header=T)
head(df)
Observation Subject Task Valence Recall
1 1 Jim Free Neg 8
2 2 Jim Free Neu 9
3 3 Jim Free Pos 5
4 4 Jim Cued Neg 7
5 5 Jim Cued Neu 9
6 6 Jim Cued Pos 10
混合線形モデルを使用してこれを分析したいと思います。考えられるすべての固定効果と変量効果を考慮すると、複数の可能なモデルがあります。
# different fixed effects with random-intercept
a0 <- lmer(Recall~1 + (1|Subject), REML=F,df)
a1 <- lmer(Recall~Task + (1|Subject), REML=F,df)
a2 <- lmer(Recall~Valence + (1|Subject), REML=F,df)
a3 <- lmer(Recall~Task+Valence + (1|Subject), REML=F,df)
a4 <- lmer(Recall~Task*Valence + (1|Subject), REML=F,df)
# different fixed effects with random-intercept-random-slope
b0 <- lmer(Recall~1 + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b1 <- lmer(Recall~Task + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b2 <- lmer(Recall~Valence + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b3 <- lmer(Recall~Task+Valence + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b4 <- lmer(Recall~Task*Valence + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
# different fixed effects with random-intercept-random-slope including variance-covariance matrix
c0 <- lmer(Recall~1 + (1 + Valence + Task|Subject), REML=F,df)
c1 <- lmer(Recall~Task + (1 + Valence + Task|Subject), REML=F,df)
c2 <- lmer(Recall~Valence + (1 + Valence + Task|Subject), REML=F,df)
c3 <- lmer(Recall~Task+Valence + (1 + Valence + Task|Subject), REML=F,df)
c4 <- lmer(Recall~Task*Valence + (1 + Valence + Task|Subject), REML=F,df)
このコンテキストで最適なモデルを選択するための推奨される方法は何ですか?対数尤度比テストを使用する場合、推奨される手順は何ですか?モデルを上向きに(ヌルモデルから最も複雑なモデルに)または下向きに(最も複雑なモデルからヌルモデルに)生成していますか?段階的な包含または除外?または、すべてのモデルを1つの対数尤度比検定に入れ、p値が最も低いモデルを選択することをお勧めしますか?ネストされていないモデルを比較する方法は?
最初に適切な固定効果構造を見つけ、次に適切な変量効果構造を見つけること、または逆の方法で見つけることをお勧めしますか(両方のオプションの参照を見つけました...)?
結果を報告する推奨される方法は何ですか?完全な混合モデル(問題の影響あり)と縮小モデル(問題の影響なし)を比較する対数尤度比検定からp値を報告します。または、対数尤度比検定を使用して最適なモデルを見つけてから、lmerTestを使用して最適なモデルの効果からp値を報告する方が良いでしょうか?