回答:
各グループの分散が同じであると仮定すると、プールされた分散の推定値を取得して、ペアごとの差のt検定を作成する際にそれを使用できます。ただし、すべての分散が小さく、すべての値が同じであることが偶然の発生である場合を除き、これは適切な仮定ではありません。それができない場合、その1つのグループの分散を推定する方法がなく、分散分析や、そのグループを比較対象のペアの1つとして含むt検定を行うことができません。
ここに、既存の回答に追加するいくつかの観察があります。なぜ分散がゼロのグループを得るのかを概念的に考えることが重要だと思います。
私の心理学の経験では、この例は、スケールに床または天井があり、スケールの真ん中に落ちるグループと極端に落ちるグループがある場合に最もよく現れます。たとえば、従属変数が5つの質問のうち正しい項目の割合である場合、「スマート」グループが100%正しいか、または「臨床グループ」が0%正しいことがわかるかもしれません。
この場合:
グループ分散が得られないもう1つのケースは、非常に小さいサンプルサイズ(例:)のグループがあり、通常はかなり離散的な従属変数と組み合わせている場合です。
この場合は、分散の欠如を偶然まで下げて、標準のt検定を続行する傾向があります。
数年前なら、@ Michael Chernickの回答を完全に購読していたでしょう。
ただし、最近、t検定の一部の実装は分散の不等式に対して非常に堅牢であることを認識しました。特に、Rでは関数t.test
にデフォルトのパラメータがありますvar.equal=FALSE
。つまり、分散のプールされた推定値に単純に依存するわけではありません。代わりに、Welch-Satterthwaiteの近似自由度を使用して、不均一な分散を補償します。
例を見てみましょう。
set.seed(123)
x <- rnorm(100)
y <- rnorm(100, sd=0.00001)
# x and y have 0 mean, but very different variance.
t.test(x,y)
Welch Two Sample t-test
data: x and y
t = 0.9904, df = 99, p-value = 0.3244
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.09071549 0.27152946
sample estimates:
mean of x mean of y
9.040591e-02 -1.075468e-06
Rがスチューデントのt 検定ではなくウェルチのt検定を実行すると主張していることがわかります。ここでは、各サンプルのサイズが100であっても、自由度は99であると主張されているため、この関数は基本的に最初のサンプルを固定値0に対してテストします。
この実装により、分散が大きく異なる2つのサンプルに対して正しい(つまり均一な)p値が得られることを確認できます。
これは、2標本t検定用です。私自身のANOVAでの経験は、分散の不平等に非常に敏感であることです。その場合、@ Michael Chernickに完全に同意します。
特定の状況下では、母集団の分散の上限を計算し、不均一な分散を持つt検定などでその分散を使用することができます。
たとえば、100人の生徒がいる学校でランダムに選択した10人の生徒に3月の好きな日を尋ねたところ、全員が15日と答えた場合、生徒の母集団に対して考えられる最大の分散は10個の値の分散であることがわかります。 15、45の値は1、45の値は31、つまり204.6364です。
分散が大きいほど、違いの検出が難しくなるはずです。そのため、分散のこの上限を使用したt検定は、違いを検出する上で控えめなものになります。これは、分散の上限を使用したt検定から生じる有意差が確実であることを意味しますが、有意差を検出しなかった場合、有意差はまだ一貫しているため、多くを知ることはできません。可能な小さな差異の一部。
もちろん、実際にこれを理解できる状況はそれほど多くないかもしれませんが、可能かもしれません。