行列の用語では、あなたのモデルは、通常の形態である。 E[ Y] = Xβ
最初のモデルは、行によって第1グループの元素を表しにXそれによって第2のグループの要素を表す3カテゴリー2及びカテゴリーの指標の指標、切片に対応し、行(1 、1 、0 )とによって第3族の元素(1 、0 、1 )。(1 、0 、0 )バツ(1 、1 、0 )(1 、0 、1 )
第2のモデルではなく、行使用、(1 、2 、2 2)= (1 、2 、4 )、及び(1 、3 、3 2)= (1 、3 、9 )、それぞれ。(1 、1 、12)= (1 、1 、1 )(1 、2 、22)= (1 、2 、4 )(1 、3 、32)= (1 、3 、9 )
結果のモデル行列およびX 2を呼び出します。それらは単に関連しています。一方の列は、もう一方の列の線形結合です。たとえば、バツ1バツ2
V= ⎛⎝⎜100112138⎞⎠⎟。
それから
⎛⎝⎜111010001⎞⎠⎟V= ⎛⎝⎜111123149⎞⎠⎟、
それはそれに従います
バツ1V= X2。
したがって、モデル自体は、
バツ1β1= E[ Y] = X2β2= (X1V)β2= X1(Vβ2)。
β2
β1= Vβ2。
したがって、同じ関係が最小二乗推定にも当てはまります。これは、モデルの適合度が同じであることを示しています。モデルの表現が異なるだけです。
2つのモデル行列の最初の列は同じであるため、最初の列と残りの列の間の分散を分解するANOVAテーブルは変更されません。ただし、2列目と3列目を区別するANOVAテーブルは、データのエンコード方法によって異なります。
R15X1X2
説明のために、ここに、あなたのデータと同様のデータ(ただし、応答は異なる)と、で生成された対応する分析を示しますR
。
set.seed(17)
D <- data.frame(group=rep(1:3, each=5), y=rnorm(3*5, rep(1:3, each=5), sd=2))
2つのモデルをフィットします。
fit.1 <- lm(y ~ factor(group), D)
fit.2 <- lm(y ~ group + I(group^2), D)
分散分析表を表示します。
anova(fit.1)
anova(fit.2)
最初のモデルの出力は
Df Sum Sq Mean Sq F value Pr(>F)
factor(group) 2 51.836 25.918 14.471 0.000634 ***
Residuals 12 21.492 1.791
2番目のモデルの場合
Df Sum Sq Mean Sq F value Pr(>F)
group 1 50.816 50.816 28.3726 0.0001803 ***
I(group^2) 1 1.020 1.020 0.5694 0.4650488
Residuals 12 21.492 1.791
残差二乗和が同じであることがわかります。2番目のモデルの最初の2行を追加すると、同じDFと二乗和が得られ、そこから同じ平均二乗、F値、およびp値を計算できます。
最後に、係数推定値を比較してみましょう。
beta.1.hat <- coef(fit.1)
beta.2.hat <- coef(fit.2)
出力は
(Intercept) factor(group)2 factor(group)3
0.4508762 2.8073697 4.5084944
(Intercept) group I(group^2)
-3.4627385 4.4667371 -0.5531225
V
⎛⎝⎜100112138⎞⎠⎟⎛⎝⎜−3.46273854.4667371−0.5531225⎞⎠⎟=⎛⎝⎜0.45087622.80736974.5084944⎞⎠⎟.
はめあいは実際に主張されているのと同じです。