1つのグループにほとんどまたはまったく差異がない場合、テストで実行できますか?


8

基準と比較している4つのグループがあります。私のグループの1つでは、すべての参加者がすべての項目で同じように回答しました。つまり、差異はありません。

ANOVAでそれをどのように処理しますか?

また、エラー条件が出ないので、テストでそれを基準と比較して実行するとどうなりますか?生徒に含めているかどうかわからない1人の参加者を含めた場合、分散は37のうちの1つの異なる観測値で完全に均一ではありませんが、実行すると、分散が小さすぎるため有意ではありません。

計算的にできることは何もないことを理解しています。私はそれを概念的にどのように扱うかを尋ねています。

回答:


2

各グループの分散が同じであると仮定すると、プールされた分散の推定値を取得して、ペアごとの差のt検定を作成する際にそれを使用できます。ただし、すべての分散が小さく、すべての値が同じであることが偶然の発生である場合を除き、これは適切な仮定ではありません。それができない場合、その1つのグループの分散を推定する方法がなく、分散分析や、そのグループを比較対象のペアの1つとして含むt検定を行うことができません。


(+1)このサイトのG Jay Kernsが、OPが説明するようなデータ分布を持つことになる別の質問に対する回答を思い出します。
アンディW

6

ここに、既存の回答に追加するいくつかの観察があります。なぜ分散がゼロのグループを得るのかを概念的に考えることが重要だと思います。

床と天井の効果

私の心理学の経験では、この例は、スケールに床または天井があり、スケールの真ん中に落ちるグループと極端に落ちるグループがある場合に最もよく現れます。たとえば、従属変数が5つの質問のうち正しい項目の割合である場合、「スマート」グループが100%正しいか、または「臨床グループ」が0%正しいことがわかるかもしれません。

この場合:

  • グループのいずれかに差異がない場合は、通常のノンパラメトリック検定に頼ることができます。
  • 事後は役に立たないかもしれませんが、床または天井の効果がなかった別のメジャーを使用した方がよいかどうかを概念的に考えることもできます。場合によっては問題にならないこともあります。たとえば、分析のポイントは、あるグループがタスクを実行でき、別のグループは実行できないことを示すことでした。他の場合では、すべてのグループの個々の違いをモデル化したい場合があります。その場合、床または天井の影響を受けないスケールが必要になることがあります。

非常に小さなグループサイズ

グループ分散が得られないもう1つのケースは、非常に小さいサンプルサイズ(例:)のグループがあり、通常はかなり離散的な従属変数と組み合わせている場合です。<5

この場合は、分散の欠如を偶然まで下げて、標準のt検定を続行する傾向があります。


3

数年前なら、@ Michael Chernickの回答を完全に購読していたでしょう。

ただし、最近、t検定の一部の実装は分散の不等式に対して非常に堅牢であることを認識しました。特に、Rでは関数t.testにデフォルトのパラメータがありますvar.equal=FALSE。つまり、分散のプールされた推定値に単純に依存するわけではありません。代わりに、Welch-Satterthwaiteの近似自由度を使用して、不均一な分散を補償します。

例を見てみましょう。

set.seed(123)
x <- rnorm(100)
y <- rnorm(100, sd=0.00001)
# x and y have 0 mean, but very different variance.
t.test(x,y)
Welch Two Sample t-test

data:  x and y 
t = 0.9904, df = 99, p-value = 0.3244
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.09071549  0.27152946 
sample estimates:
    mean of x     mean of y 
 9.040591e-02 -1.075468e-06

Rがスチューデントのt 検定ではなくウェルチのt検定を実行すると主張していることがわかります。ここでは、各サンプルのサイズが100であっても、自由度は99であると主張されているため、この関数は基本的に最初のサンプルを固定値0に対してテストします。

この実装により、分散が大きく異なる2つのサンプルに対して正しい(つまり均一な)p値が得られることを確認できます。

これは、2標本t検定用です。私自身のANOVAでの経験は、分散の不平等に非常に敏感であることです。その場合、@ Michael Chernickに完全に同意します。


そのアプローチが基本的に最初のグループをゼロと比較するのと同じである場合、変化しないグループの観測値を他の値から差し引いてゼロと比較しないのはなぜですか?言い換えれば、変動性の利用可能な唯一の推定値を使用して、1サンプルのt検定を実行するだけです。これは、Welch-Scatterthwaiteテストを使用するよりも概念的には単純に思えます。
Michael Lew

絶対に正しい@Michael Lew。これは極端なケースであるため、私の例はあまり教訓的ではありませんでした。ウェルチのt検定は、サンプルの分散が4分の1であるような境界線の場合に役立ちます。私は、このアプローチが限界の中で一貫していることを強調したかっただけです。
gui11aume

3

特定の状況下では、母集団の分散の上限を計算し、不均一な分散を持つt検定などでその分散を使用することができます。

たとえば、100人の生徒がいる学校でランダムに選択した10人の生徒に3月の好きな日を尋ねたところ、全員が15日と答えた場合、生徒の母集団に対して考えられる最大の分散は10個の値の分散であることがわかります。 15、45の値は1、45の値は31、つまり204.6364です。

分散が大きいほど、違いの検出が難しくなるはずです。そのため、分散のこの上限を使用したt検定は、違いを検出する上で控えめなものになります。これは、分散の上限を使用したt検定から生じる有意差が確実であることを意味しますが、有意差を検出しなかった場合、有意差はまだ一貫しているため、多くを知ることはできません。可能な小さな差異の一部。

もちろん、実際にこれを理解できる状況はそれほど多くないかもしれませんが、可能かもしれません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.