同じ基本的な統計手法のすべてのバージョンはどうですか?
同じ基本的な統計手法のすべてのバージョンはどうですか?
回答:
それらはすべて回帰式として記述できることを考慮してください(おそらく、従来の形式とは少し異なる解釈で)。
回帰:
t検定:
ANOVA:
プロトタイプ回帰は、を連続変数として概念化されています。ただし、について実際に行われる唯一の仮定は、が既知の定数のベクトルであるということです。連続変数でも可能ですが、ダミーコード(つまり、観測値が指定されたグループ(治療グループなど)のメンバーであるかどうかを示す&のベクトル)でも。したがって、2番目の式では、はそのようなダミーコードである可能性があり、p値はより伝統的な形式のt検定の値と同じになります。 X 0 1 X
ただし、ベータ版の意味はここでは異なります。この場合、はコントロールグループの平均(ダミー変数のエントリがなる)になり、は治療グループの平均とコントロールの平均の差になりますグループ。 0 β 1
ここで、2つのグループのみでANOVAを実行/実行することは完全に合理的であり(t検定の方が一般的ですが)、3つすべてが接続されていることを忘れないでください。3グループのANOVAがある場合の動作を確認したい場合は、それは次のようになり: グループがある場合、それらを表すダミーコード があることに注意してください。参照グループ(通常はコントロールグループ)は、すべてに指定することで示されます。G G - 1 0 β 0 β 1 β 2
以下@ whuberのコメントに照らして、これらはまた、行列方程式を介して表すことができる:
この方法で表される&長さのベクトルである、およびは長さベクトルです。は、行列の行列になりました。プロトタイプ回帰では、連続変数と切片があります。したがって、行列は、ごとに1つずつ並んだ一連の列ベクトルで構成されます。
この方法でグループを使用してANOVAを表す場合、グループを示すダミー変数があり、参照グループは各ダミー変数にを持つ観測値で示されることに注意してください。上記のように、まだインターセプトがあります。したがって、です。 g − 1 0 p = g − 1
これらはすべて、一般線形モデルの特定のケースとして記述できます。
t検定は、ANOVAの2サンプルのケースです。t検定統計量を2乗すると、ANOVAで対応するが得られます。
ANOVAモデルは基本的に、因子レベルがダミー(またはインジケーター)変数で表される単なる回帰モデルです。
したがって、t検定のモデルがANOVAモデルのサブセットであり、ANOVAが重回帰モデルのサブセットである場合、回帰自体(および回帰以外の他のもの)は一般線形モデルのサブセットであり、回帰を(「独立」と「等しい分散」である)通常の回帰場合よりも、多変量の誤差項のより一般的な仕様。
これは、通常の(等分散)2つのsample-分析とRで行われた回帰モデルの仮説検定の等価性を示す例です(実際のデータはペアになっているように見えるため、これは実際には適切な分析ではありません) :
> t.test(extra ~ group, var.equal=TRUE, data = sleep)
Two Sample t-test
data: extra by group
t = -1.8608, df = 18, p-value = 0.07919
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.363874 0.203874
sample estimates:
mean in group 1 mean in group 2
0.75 2.33
上記の0.079のp値に注意してください。これが一方向のanovaです。
> summary(aov(extra~group,sleep))
Df Sum Sq Mean Sq F value Pr(>F)
group 1 12.48 12.482 3.463 0.0792
Residuals 18 64.89 3.605
回帰の場合:
> summary(lm(extra ~ group, data = sleep))
(一部の出力が削除されました)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.7500 0.6004 1.249 0.2276
group2 1.5800 0.8491 1.861 0.0792 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.899 on 18 degrees of freedom
Multiple R-squared: 0.1613, Adjusted R-squared: 0.1147
F-statistic: 3.463 on 1 and 18 DF, p-value: 0.07919
'group2'行のp値と、最後の行のF検定のp値を比較します。両側検定の場合、これらは同じであり、両方ともt検定の結果と一致します。
さらに、「group2」の係数は、2つのグループの平均の差を表します。