私は一般的にベンの分析に同意しますが、いくつかの発言と少しの直観を加えさせてください。
まず、全体的な結果:
- Satterthwaiteメソッドを使用したlmerTestの結果は正しい
- Kenward-Rogerの方法も正しく、Satterthwaiteに同意します
ベンsubnum
は、group
whileにネストされ、direction
とgroup:direction
交差するデザインの概要を説明していsubnum
ます。以下のための自然な誤差項(いわゆる「囲みエラー地層が」)というこれは手段group
であるsubnum
他の用語のための囲みエラー地層(含めてsubnum
)残差があります。
この構造は、いわゆる因子構造図で表すことができます。
names <- c(expression("[I]"[5169]^{5191}),
expression("[subnum]"[18]^{20}), expression(grp:dir[1]^{4}),
expression(dir[1]^{2}), expression(grp[1]^{2}), expression(0[1]^{1}))
x <- c(2, 4, 4, 6, 6, 8)
y <- c(5, 7, 5, 3, 7, 5)
plot(NA, NA, xlim=c(2, 8), ylim=c(2, 8), type="n", axes=F, xlab="", ylab="")
text(x, y, names) # Add text according to ’names’ vector
# Define coordinates for start (x0, y0) and end (x1, y1) of arrows:
x0 <- c(1.8, 1.8, 4.2, 4.2, 4.2, 6, 6) + .5
y0 <- c(5, 5, 7, 5, 5, 3, 7)
x1 <- c(2.7, 2.7, 5, 5, 5, 7.2, 7.2) + .5
y1 <- c(5, 7, 7, 3, 7, 5, 5)
arrows(x0, y0, x1, y1, length=0.1)
ここで、ランダムな用語は括弧で囲まれ0
、全体の平均(または切片)を[I]
表し、誤差の項を表し、上付きの数字はレベルの数であり、下付きの数字はバランスの取れた設計を想定した自由度の数です。この図は、の自然誤差項(囲み誤差層)がgroup
でsubnum
あり、の分子df(の分母dfにsubnum
等しいgroup
)が18であることを示しています:20-1 group
dfと全体平均の1 df 因子構造図のより包括的な概要については、第2章のhttps://02429.compute.dtu.dk/eBookを参照してください。
データが正確にバランスが取れていれば、によって提供されるSSQ分解からF検定を構築できanova.lm
ます。データセットは非常に密接にバランスが取れているため、次のように近似F検定を取得できます。
ANT.2 <- subset(ANT, !error)
set.seed(101)
baseline.shift <- rnorm(length(unique(ANT.2$subnum)), 0, 50)
ANT.2$rt <- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)]
fm <- lm(rt ~ group * direction + subnum, data=ANT.2)
(an <- anova(fm))
Analysis of Variance Table
Response: rt
Df Sum Sq Mean Sq F value Pr(>F)
group 1 994365 994365 200.5461 <2e-16 ***
direction 1 1568 1568 0.3163 0.5739
subnum 18 7576606 420923 84.8927 <2e-16 ***
group:direction 1 11561 11561 2.3316 0.1268
Residuals 5169 25629383 4958
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
ここですべてのFとpの値は、すべての項が残差をそれらの囲んでいるエラーストラタムとして持つと想定して計算され、それは「グループ」以外のすべてに当てはまります。代わりに、グループの「バランスの取れた」F検定は次のとおりです。
F_group <- an["group", "Mean Sq"] / an["subnum", "Mean Sq"]
c(Fvalue=F_group, pvalue=pf(F_group, 1, 18, lower.tail = FALSE))
Fvalue pvalue
2.3623466 0.1416875
ここでは、F値の分母にsubnum
MSの代わりにMS を使用しています。Residuals
これらの値はSatterthwaiteの結果と非常によく一致することに注意してください。
model <- lmer(rt ~ group * direction + (1 | subnum), data = ANT.2)
anova(model, type=1)
Type I Analysis of Variance Table with Satterthwaite's method
Sum Sq Mean Sq NumDF DenDF F value Pr(>F)
group 12065.3 12065.3 1 18 2.4334 0.1362
direction 1951.8 1951.8 1 5169 0.3936 0.5304
group:direction 11552.2 11552.2 1 5169 2.3299 0.1270
残りの違いは、データが正確にバランスされていないためです。
OPはと比較anova.lm
しますanova.lmerModLmerTest
。これは問題ありませんが、同じように比較するには、同じコントラストを使用する必要があります。この場合には差があるanova.lm
とanova.lmerModLmerTest
、それらがそれぞれデフォルトではI型およびIIIのテストを生成し、このデータセットのためのI型およびIIIコントラストとの間の(小)差があるために。
show_tests(anova(model, type=1))$group
(Intercept) groupTreatment directionright groupTreatment:directionright
groupTreatment 0 1 0.005202759 0.5013477
show_tests(anova(model, type=3))$group # type=3 is default
(Intercept) groupTreatment directionright groupTreatment:directionright
groupTreatment 0 1 0 0.5
データセットが完全にバランスが取れていた場合、タイプIのコントラストはタイプIIIのコントラストと同じになります(観察されたサンプル数の影響を受けません)。
最後の注意点の1つは、Kenward-Roger法の「遅さ」はモデルの再フィッティングによるものではなく、観測/残差(この場合は5191x5191)の限界分散共分散行列による計算が含まれるためです。 Satterthwaiteの方法の場合。
モデル2について
MODEL2に関しては、状況はより複雑になり、私は私が「古典的」な相互作用の間に含まれている他のモデルとの議論を開始する方が簡単だと思うsubnum
とをdirection
:
model3 <- lmer(rt ~ group * direction + (1 | subnum) +
(1 | subnum:direction), data = ANT.2)
VarCorr(model3)
Groups Name Std.Dev.
subnum:direction (Intercept) 1.7008e-06
subnum (Intercept) 4.0100e+01
Residual 7.0415e+01
交互作用に関連する分散は(subnum
ランダムな主効果の存在下で)本質的にゼロであるため、交互作用項は分母の自由度、F値およびp値の計算に影響を与えません。
anova(model3, type=1)
Type I Analysis of Variance Table with Satterthwaite's method
Sum Sq Mean Sq NumDF DenDF F value Pr(>F)
group 12065.3 12065.3 1 18 2.4334 0.1362
direction 1951.8 1951.8 1 5169 0.3936 0.5304
group:direction 11552.2 11552.2 1 5169 2.3299 0.1270
ただし、subnum:direction
それを囲んでいるエラーストラタムであるsubnum
ためsubnum
、関連するすべてのSSQ を削除すると、subnum:direction
model4 <- lmer(rt ~ group * direction +
(1 | subnum:direction), data = ANT.2)
今のための自然な誤差項group
、direction
およびはgroup:direction
ある
subnum:direction
としてnlevels(with(ANT.2, subnum:direction))
= 40と四つのパラメータこれらの用語の自由分母度は36であるべきです:
anova(model4, type=1)
Type I Analysis of Variance Table with Satterthwaite's method
Sum Sq Mean Sq NumDF DenDF F value Pr(>F)
group 24004.5 24004.5 1 35.994 4.8325 0.03444 *
direction 50.6 50.6 1 35.994 0.0102 0.92020
group:direction 273.4 273.4 1 35.994 0.0551 0.81583
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
これらのF検定は、「バランスのとれた」F検定で近似することもできます。
an4 <- anova(lm(rt ~ group*direction + subnum:direction, data=ANT.2))
an4[1:3, "F value"] <- an4[1:3, "Mean Sq"] / an4[4, "Mean Sq"]
an4[1:3, "Pr(>F)"] <- pf(an4[1:3, "F value"], 1, 36, lower.tail = FALSE)
an4
Analysis of Variance Table
Response: rt
Df Sum Sq Mean Sq F value Pr(>F)
group 1 994365 994365 4.6976 0.0369 *
direction 1 1568 1568 0.0074 0.9319
group:direction 1 10795 10795 0.0510 0.8226
direction:subnum 36 7620271 211674 42.6137 <2e-16 ***
Residuals 5151 25586484 4967
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
今model2に目を向けます:
model2 <- lmer(rt ~ group * direction + (direction | subnum), data = ANT.2)
このモデルは、2x2分散共分散行列を使用したかなり複雑な変量効果共分散構造を記述します。デフォルトのパラメーター化は簡単に処理できず、モデルの再パラメーター化の方が優れています。
model2 <- lmer(rt ~ group * direction + (0 + direction | subnum), data = ANT.2)
と比較するmodel2
とmodel4
、同等のランダム効果があります。それぞれsubnum
に2つ、つまり合計で2 * 20 = 40。ながらmodel4
規定全て40のランダム効果のための単一の分散パラメータは、model2
各ことを規定subnum
ランダム効果の-pairは、のパラメータはによって与えられる分散共分散行列の2x2と二変量正規分布を有しています
VarCorr(model2)
Groups Name Std.Dev. Corr
subnum directionleft 38.880
directionright 41.324 1.000
Residual 70.405
これは過剰適合を示していますが、別の日のために保存しておきましょう。ここで重要な点は、それがあるmodel4
の特殊なケースであるmodel2
とことmodel
でも特殊なケースmodel2
。大まかに(そして直感的に)話すこと(direction | subnum)
は、主な効果subnum
と相互作用に関連するバリエーションを含むか、またはキャプチャしdirection:subnum
ます。変量効果の観点から、これらの2つの効果または構造は、行と列ごとの変化をそれぞれ捉えると考えることができます。
head(ranef(model2)$subnum)
directionleft directionright
1 -25.453576 -27.053697
2 16.446105 17.479977
3 -47.828568 -50.835277
4 -1.980433 -2.104932
5 5.647213 6.002221
6 41.493591 44.102056
この場合、これらのランダム効果の推定値と分散パラメーターの推定値はどちらも、subnum
ここには(行間の変化)のランダムな主効果のみが実際にあることを示しています。これがすべてを導くのは、Satterthwaiteの分母の自由度が
anova(model2, type=1)
Type I Analysis of Variance Table with Satterthwaite's method
Sum Sq Mean Sq NumDF DenDF F value Pr(>F)
group 12059.8 12059.8 1 17.998 2.4329 0.1362
direction 1803.6 1803.6 1 125.135 0.3638 0.5475
group:direction 10616.6 10616.6 1 125.136 2.1418 0.1458
これらの主効果及び相互作用構造の間の妥協である:グループDenDFは18のままである(にネストsubnum
設計によって)しかしdirection
と
group:direction
DenDF 36との間の妥協(ARE model4
)および5169( model
)。
ここでは、Satterthwaite近似(またはlmerTestでの実装)に問題があることを示しているとは思いません。
Kenward-Roger法を使用した同等の表では、
anova(model2, type=1, ddf="Ken")
Type I Analysis of Variance Table with Kenward-Roger's method
Sum Sq Mean Sq NumDF DenDF F value Pr(>F)
group 12059.8 12059.8 1 18.000 2.4329 0.1362
direction 1803.2 1803.2 1 17.987 0.3638 0.5539
group:direction 10614.7 10614.7 1 17.987 2.1414 0.1606
KRとSatterthwaiteが異なる可能性があることは驚くべきことではありませんが、実際には、p値の違いはわずかです。上記の私の分析では、ことを示しているDenDF
ためdirection
とgroup:direction
〜36よりも小さく、私たちは基本的に唯一のランダムな主効果があることを与えられたものよりもおそらく大きくするべきではないdirection
、存在をどちらかと言えばそう、私は、これはKR方法が得ることの指標であると考えるDenDF
が低すぎるとこの場合。ただし、データは実際には(group | direction)
構造をサポートしていないため、比較は少し人為的なものであることに注意してください。モデルが実際にサポートされていると、より興味深いものになります。
ezAnova
実際にデータが2x2x2設計のものである場合は、2x2 anovaを実行しないでください。警告を理解しました。