次の状況を想定します。
小さいグループサイズ(たとえばn = 3)で多数(たとえば20)があります。均一な分布から値を生成すると、エラー分布が均一であっても残差がほぼ正規に見えることに気付きました。次のRコードは、この動作を示しています。
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
3つのグループのサンプルの残差を見ると、動作の理由は明らかです。
以来、概ね異ならない標準偏差を有するランダム変数の和であり、その分布はかなり近い正規分布に個々の用語よりなります。
ここで、シミュレートされたデータではなく、実際のデータで同じ状況があると仮定します。正規性に関するANOVAの仮定が成り立つかどうかを評価したいと思います。最も推奨される手順では、残差の目視検査(QQプロットなど)または残差の正規性テストを推奨しています。上記の私の例のように、これは小さなグループサイズには本当に最適ではありません。
小さなサイズのグループが多数ある場合、より良い代替手段はありますか?