グループ間に有意差があるかどうかをテストするために一元配置分散分析を実行している場合、暗黙的に2つのネストされたモデルを比較しています(ネストのレベルは1つだけですが、それでもネストされます)。
これらの2つのモデルは次のとおりです。
ネストされたモデルとの平均と同等性の比較の例:アイリスデータセットからがく片の長さ(cm)を取得しましょう(4つの変数すべてを使用する場合、フィッシャーが1936年に行ったように、実際にLDAまたはMANOVAを実行できます)
観測された合計とグループの平均は次のとおりです。
μtotalμsetosaμversicolorμvirginica=5.83=5.01=5.94=6.59
これはモデル形式です:
model 1: model 2: yij=5.83+ϵiyij=5.01+⎡⎣⎢00.931.58⎤⎦⎥j+ϵi
∑ϵ2i=102.1683
∑ϵ2i=38.9562
そして、分散分析表は次のようになります(2自由度の表の63.212であるグループ二乗和の間の差を暗黙的に計算します)。
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
F=RSSdifferenceDFdifferenceRSSnewDFnew=63.212238.956147=119.26
例で使用されているデータセット:
アイリスの花の3つの異なる種の花びらの長さ(cm)
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()
関数として実装されています。これは、最初の実際のANOVAもF-testを使用しているためです。これは、用語の混乱を招きます。