線形回帰のt検定とANOVAの違いは何ですか?
- 傾斜と切片のいずれか1つが平均ゼロであるかどうかをテストするt検定ですが、ANOVAはすべての傾斜が平均ゼロであるかどうかをテストしますか?これが唯一の違いですか?
- 予測変数が1つしかない単純な線形回帰では、推定する勾配は1つだけです。t検定とANOVAは同等です。もしそうなら、異なる統計を使用している場合(t検定はt統計を使用し、ANOVAはF統計を使用している場合)
線形回帰のt検定とANOVAの違いは何ですか?
回答:
一般的な線形モデルでは、ANOVAモデルを回帰モデルとして作成できます。それぞれ2つの観測値を持つ2つのグループ、つまりベクトル 4つの観測値があるとします。次に、元のオーバーパラメーター化されたモデルはで、は予測子の行列、つまり、ダミーコード化されたインジケーター変数です: E (Y )= X ⋆ β ⋆ X ⋆ (μ 1 μ 1 μ 2 μ 2) = (1 1 0 1 1 0 1 0 1 1 0 1)(β ⋆ 0 β ⋆ 1 β ⋆ 2)
パラメータはとして識別できないので、ランクを有します2(は可逆的ではありません)。これを変更するために、制約(処理のコントラスト)を導入します。これにより、新しいモデル: X ⋆(X ⋆)' X ⋆ β ⋆ 1 = 0 E (Y )= X β (μ 1 μ 1 μ 2 μ 2) = (1 0 1 0 1 1 1 1
したがって、、つまりは、参照カテゴリ(グループ1)からの期待値の意味を取ります。、つまりは参照カテゴリとの差の意味を取ります。2つのグループでは、グループ効果に関連付けられたパラメーターが1つしかないため、ANOVA帰無仮説(すべてのグループ効果パラメーターは0)は回帰重み帰無仮説(勾配パラメーターは0)と同じです。
一般線形モデルで検定は線形組み合わせテストパラメーターの仮定値に対してヌル仮説の下を。選択すると、(勾配パラメーターの通常のテスト)、つまりここではという仮説をテストできます。推定量は、ここではパラメーターのOLS推定。このようなの一般的な検定統計量は次のとおりです
は誤差分散の不偏推定量で、ここでは、二乗残差の合計です。2つのグループの場合、、したがって推定量はと。私達の場合には1であり、検定統計量は次のようになる。
は df(ここでは)で分布しています。を2乗すると、、ANOVAからの検定統計量二つのグループのための検定(間ため、は次のグループ内の場合) - 1および分布 df。
3つ以上のグループがある場合、ANOVA仮説(すべてのは同時に0、1)は複数のパラメーターを参照し、線形結合として表現できないため、テストは等価ではありません。
1では、ANOVAは通常、因子変数をテストし、グループ間の分散が有意であるかどうかをテストします。ソフトウェアが回帰で指標変数を許可している場合、違いが明確にわかります。各ダミーについて、このグループのスコアが0と大きく異なるかどうかを示すp値が得られ、結果として適用可能な参照グループまたは参照値と大きく異なります。通常、ANOVAテストを実行するまで、インジケーター自体がどの程度重要であるかはわかりません。
F検定は2乗t検定です。したがって、2では同じです。