2つのグループのt検定とANOVAが同等である場合、それらの仮定が同等ではないのはなぜですか?


47

私はこれを完全に頭に包んでいると確信していますが、私はそれを理解することができません。

t検定は、Z分布を使用して2つの正規分布を比較します。これが、データに正規性の仮定がある理由です。

ANOVAは、ダミー変数を使用した線形回帰に相当し、OLSと同様に平方和を使用します。それが、残差の正常性の仮定がある理由です。

私は数年かかったが、私は最終的にそれらの基本的な事実を把握したと思います。それでは、なぜt検定は2つのグループのANOVAと同等なのでしょうか?データについて同じことを想定していない場合、どうすれば同等になりますか?


15
ワンポイント:t検定は、t分布ではないZ分布使用
Jeromy Anglim

1
質問は正しくありませんが、非常に便利です。また、どこかで「両側t検定」に言及すると、質問/回答がより完全になると思います。
ガウラフシンハル

回答:


29

2つのグループを含むt検定では、各グループが同じ分散で正規分布していると仮定しています(ただし、対立仮説では平均が異なる場合があります)。回帰により各グループの平均は異なるが分散は許容されないため、これはダミー変数を使用した回帰と同等です。したがって、残差(グループ平均が減算されたデータに等しい)は同じ分布を持ちます。つまり、通常は平均がゼロで分布します。

不等分散のt検定は、一元配置分散分析と同等ではありません。


3
引用を調べることはできますが、これは経験的にテストするのに十分簡単です。2つのグループを持つANOVAからのFはt ^ 2とまったく等しく、p値はまったく同じです。不均等な分散の場合に同等ではない唯一の理由は、修正を適用する場合です。それ以外は同じです。
ブレット

3
F検定は、t検定の一般化です。t検定は2治療の比較用で、F検定は複数の治療用です。導出は、CasellaのStatistics Designの第3章および第4章にあります。しかし、Hindman教授が指摘するように、不等分散で、これはもはやt検定ではありません。それはフィッシャー・ベーレンの問題です。通常、フィッシャーのソリューションを使用せず、代わりにウェルチのテストまたはベイジアンアプローチを使用します。
-suncoolsu

不等分散の2標本t検定は、実際には2グループの1因子ANOVAと等しくなります。おそらく、不均等な分散(つまりウェルチ)の修正を使用したt検定は、修正されていない一元配置分散分析と同じではないということでしょうか(なぜそうなるのでしょうか)。
ブレット

20

t検定は、2つのグループのみが比較されるF検定の特殊なケースです。どちらの結果もp値に関してまったく同じであり、F統計とt統計の間にも単純な関係があります。F = t ^ 2。2つのテストは代数的に同等であり、それらの仮定は同じです。

実際、これらの同等性は、ANOVA、t検定、線形回帰モデルのクラス全体にまで及びます。t検定はANOVAの特殊なケースです。ANOVAは回帰の特殊なケースです。これらの手順はすべて、一般線形モデルに基づいており、同じ仮定を共有しています。

  1. 観測の独立。
  2. 残差の正規性=特別な場合の各グループの正規性。
  3. 残差の分散の等しい=特別な場合のグループ全体で等しい分散。

データの正規性と考えるかもしれませんが、各グループの正規性をチェックしています-これは、実際にはモデルの唯一の予測子がグループの指標である場合の残差の正規性のチェックと同じです。同様に分散が等しい。

余談ですが、RにはANOVA用の個別のルーチンはありません。Rのanova関数は、線形回帰モデルの適合に使用されるものと同じlm()関数の単なるラッパーであり、回帰サマリーではなくANOVAサマリーで通常見られるものを提供するために少し異なってパッケージ化されています。


lmを使用して反復測定ANOVAモデルを適合させる方法を知りたいと思います。
AndyF

1
この記事では、カテゴリ変数のコーディング、回帰モデルとANOVAモデルの等価性、および反復測定の回帰コーディングの問題について説明します。dionysus.psych.wisc.edu/Lit/Topics/Statistics/Contrasts/…ここに引用があります...カリフォルニア州ウェンドルフ(2004)。重回帰コーディングの入門:一般的な形式と、コントラストが繰り返される追加のケース。統計3、47-57を理解する。
ブレット

4
@AndyF Not lm()では、nlmeor lme4パッケージを使用して混合モデルに移行しない限り、のError用語を適切に指定して繰り返し測定を処理する便利な方法があります。Baronaov()&Liチュートリアル、§6.9、j.mp
chl

@AndyF aov()lm()関数の上に構築されますが、などの特別な用語と呼ばれる追加の引数を含みますError
chl

aov()はlm()の単なるラッパーです。舞台裏でいくつかの対照的なコーディングを行い、結果をANOVAスタイルでパッケージ化します。すべてはlm()によってモデル化されています。上記で参照した記事では、lm()を含む回帰モデルで繰り返しコントラストを行うためのコーディングのセットアップ方法を説明しています。
ブレット

17

ロブの答えには完全に同意しますが、別の言い方をしましょう(ウィキペディアを使用):

仮定の分散分析

  • ケースの独立性-これは、統計分析を簡素化するモデルの仮定です。
  • 正規性-残差の分布は正規です。
  • 等分散性と呼ばれる分散の平等(または「均質性」)

仮定t検定

  • 比較される2つの母集団はそれぞれ正規分布に従う必要があります...
  • ...比較される2つの母集団の分散は同じでなければなりません...
  • テストの実行に使用されるデータは、比較される2つの母集団から独立してサンプリングする必要があります。

したがって、それらは明らかに同じ仮定を持っているので、質問に反論します(ただし、順序は異なります:-))。


ロブへのコメントを参照してください。
アレクシス

@アレクシスあなたのダウン投票を理解しているかどうかはわかりません。手入れを気に。
ヘンリック

2番目のt検定の仮定は正しくありません。学生の元の作業はこれを想定していましたが、「不均等な分散」は後のテストの処理で十分に一般的な前提です。
アレクシス

5

誰もが見落としている明らかな点:ANOVAを使用すると、説明変数の値に関係なく平均が同一であるというヌルをテストします。T検定を使用すると、説明変数の1つの値が他の値よりも具体的に大きいという片側のケースもテストできます。


1
誤解しない限り、これは違いではありません。2つのグループでANOVAを行う場合、t検定と同様に「片側検定」を行うことができます。実際に「片側テスト」と「両側テスト」の「テスト」に違いはないので、「片側テスト」を引用符で囲みます。唯一の違いは、p値の統計的有意性の解釈方法です。したがって、片側と両側の「テスト」はまったく同じ「テスト」です。結果を正しく解釈する方法のみが異なります。
Tripartio

-3

理由により、2つのグループの比較にはt検定を使用し、3つ以上のグループにはANOVAを使用することを好みます。重要な理由は、等分散の仮定です。


5
サイト@syedへようこそ。答えを広げていただけますか?たとえば、「理由」とは何ですか?t検定とANOVAの両方が等しい分散を仮定していることに注意してください。
GUNG -復活モニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.