線形回帰におけるt検定とANOVAの違い


12

線形回帰のt検定とANOVAの違いは何ですか?

  1. 傾斜と切片のいずれか1つが平均ゼロであるかどうかをテストするt検定ですが、ANOVAはすべての傾斜が平均ゼロであるかどうかをテストしますか?これが唯一の違いですか?
  2. 予測変数が1つしかない単純な線形回帰では、推定する勾配は1つだけです。t検定とANOVAは同等です。もしそうなら、異なる統計を使用している場合(t検定はt統計を使用し、ANOVAはF統計を使用している場合)

Ad 1)線形回帰では、通常、ANOVAはモデルの適合度の尺度として理解します。つまり、モデル(回帰直線)が全変動のかなりの部分を説明するかどうかを決定します。質問は、すべての勾配がゼロであることに相当するかどうか、本当に興味深いです。広告2)この場合、t検定と回帰ANOVAでほぼ同じp値を取得しているようです。本当に興味深い定理!
好奇心が

回答:


18

一般的な線形モデルでは、ANOVAモデルを回帰モデルとして作成できます。それぞれ2つの観測値を持つ2つのグループ、つまりベクトル 4つの観測値があるとします。次に、元のオーバーパラメーター化されたモデルはで、は予測子の行列、つまり、ダミーコード化されたインジケーター変数です: E Y = X β X μ 1 μ 1 μ 2 μ 2 = 1 1 0 1 1 0 1 0 1 1 0 1β 0 β 1 β 2yE(y)=XβX

μ1μ1μ2μ2=(110110101101)(β0β1β2)

パラメータはとして識別できないので、ランクを有します2(は可逆的ではありません)。これを変更するために、制約(処理のコントラスト)を導入します。これにより、新しいモデル: X X ' X β 1 = 0 E Y = X β μ 1 μ 1 μ 2 μ 2 = 1 0 1 0 1 1 1 1バツバツ1バツEyバツバツバツβ1=0Ey=バツβ

μ1μ1μ2μ2=10101111β0β2

したがって、、つまりは、参照カテゴリ(グループ1)からの期待値の意味を取ります。、つまりは参照カテゴリとの差の意味を取ります。2つのグループでは、グループ効果に関連付けられたパラメーターが1つしかないため、ANOVA帰無仮説(すべてのグループ効果パラメーターは0)は回帰重み帰無仮説(勾配パラメーターは0)と同じです。μ1=β0β0μ2=β0+β2β2μ2μ1

一般線形モデルで検定は線形組み合わせテストパラメーターの仮定値に対してヌル仮説の下を。選択すると、(勾配パラメーターの通常のテスト)、つまりここではという仮説をテストできます。推定量は、ここではパラメーターのOLS推定。このようなの一般的な検定統計量は次のとおりです tψ=cjβjψ0c=(0,1)β2=0μ2μ1=0ψ^=cjβ^jβ^=(XX)1Xyψ

t=ψ^ψ0σ^c(XX)1c

σ^2=e2/(nRank(X))は誤差分散の不偏推定量で、ここでは、二乗残差の合計です。2つのグループの場合、、したがって推定量はと。私達の場合には1であり、検定統計量は次のようになる。 e2Rank(X)=2(XX)1X=(.5.500.5.5.5.5)β^0=0.5y1+0.5y2=M1β^2=0.5y10.5y2+0.5y3+0.5y4=M2M1c(XX)1c

t=M2M10σ^=M2M1e2/(n2)

tは df(ここでは)で分布しています。を2乗すると、、ANOVAからの検定統計量二つのグループのための検定(間ため、は次のグループ内の場合) - 1および分布 df。tnRank(X)n2t(M2M1)2/1e2/(n2)=SSb/dfbSSw/dfw=FFbwFnRank(X)

3つ以上のグループがある場合、ANOVA仮説(すべてのは同時に0、1)は複数のパラメーターを参照し、線形結合として表現できないため、テストは等価ではありません。βj1jψ


3

1では、ANOVAは通常、因子変数をテストし、グループ間の分散が有意であるかどうかをテストします。ソフトウェアが回帰で指標変数を許可している場合、違いが明確にわかります。各ダミーについて、このグループのスコアが0と大きく異なるかどうかを示すp値が得られ、結果として適用可能な参照グループまたは参照値と大きく異なります。通常、ANOVAテストを実行するまで、インジケーター自体がどの程度重要であるかはわかりません。

F検定は2乗t検定です。したがって、2では同じです。


ありがとう!(1)インジケーター変数とはどういう意味ですか?(2)一般に、t検定は、グループが2つしかない場合にのみANOVAと同等です。ただし、単純な線形回帰では、3つ以上のグループが存在する場合があります。グループの数は、予測変数がデータセットで取る値の数です。
ティム

(1)指標変数またはカテゴリ変数または因子変数...すべて同じ。(2)確かに、しかし、あなたはANOVAからのダミー/カテゴリーのスコアのスコアを知りたいかもしれません。
労働

ありがとう!(2)単純な線形回帰では、3つ以上のグループがある場合、t検定はどのようにANOVAと同等ですか?「ANOVAのダミー/カテゴリスコアのセット」はどういう意味ですか?また、なぜそれを知りたいのですか?
ティム

OLS回帰では、定義するグループの数に関係なく、R²(説明される分散)はeta²またはANOVAからのMSS / TSSに等しくなります。次に、ダミーのセット(つまり、インジケータ変数)の寄与を知り、セット自体が関連するかどうか、どの程度までかを知りたい場合があります。 。
労働
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.