巨大なサンプルでt検定を実行する方法は?


11

私には2つの母集団があり、1つはN = 38,704(観測数)、もう1つはN = 1,313,662です。これらのデータセットには、25個までの変数があり、すべて連続しています。各データセットのそれぞれの平均を取り、式を使用して検定統計量を計算しました

t =平均差/標準誤差

問題は自由度です。df = N1 + N2-2の式により、テーブルが処理できる以上の自由度が得られます。これについて何か提案はありますか?ここでt統計を確認する方法。t検定がサンプルの処理に使用されることは知っていますが、これを大きなサンプルに適用するとどうなるでしょうか。

回答:


20

chlは、同じデータセットで25のテストを同時に実行する場合の複数比較のトラップについてすでに述べました。これを処理する簡単な方法は、p値のしきい値をテストの数(この場合は25)で割って調整することです。より正確な式は次のとおりです。調整されたp値= 1-(1-p値)^(1 / n)。ただし、2つの異なる式は、ほぼ同じ調整済みp値を導き出します。

仮説検証の演習には別の大きな問題があります。Type Iエラー(誤検知)に遭遇することは間違いなく、99.9999%レベルで非常に重要ないくつかの些細な違いが明らかになります。これは、このような大きなサイズ(n = 1,313,662)のサンプルを処理すると、0に非常に近い標準エラーが発生するためです。これは、1,313,662 = 1,146の平方根であるためです。したがって、標準偏差を1,146で割ります。つまり、完全に重要ではない可能性のある微妙な違いをキャプチャします。

この仮説テストフレームワークから離れて、代わりに効果サイズタイプの分析を行うことをお勧めします。このフレームワーク内では、統計的距離の測定は標準偏差です。標準誤差とは異なり、標準偏差はサンプルのサイズによって人為的に縮小されません。また、このアプローチにより、データセット間の重要な違いをよりよく理解できます。効果サイズは、平均の平均差の周囲の信頼区間にもより焦点が当てられています。これは、仮説検定が統計的有意性に焦点を合わせるよりもはるかに有益である場合よりもはるかに有益です。お役に立てば幸いです。


4
重要なアイデアを引き出すための+1:(1)データセットがこのように大きい場合に平均が異なることを保証でき、(2)他の分析がより適切で有用である可能性があります。ただし、分析の目的がわからないため、具体的な推奨事項については慎重に検討する必要があります。
whuber

ありがとう、ガエタン。私がこれから取り除いたのは、私のような大きなサンプルがある場合、標準偏差がより良い測定値であるということだと思います。何かを逃した場合は、お知らせください。
ayush biyani 2010年

1
ayush ...あなたは正しいです。それは基本的にそれです。また、これは、サンプルサイズが大きいために標準誤差が非常に小さくなるためです。これは、テストグループとコントロールグループの間の統計的な距離を過大評価します。そして、最終的にタイプIエラーに遭遇します(重要ではないほど小さい差異を明らかにします)。これは、大量のサンプルを使用した仮説検定でよくある問題です。
2010年

14

スチューデントのt分布は、自由度が大きくなるにつれて、標準正規分布にますます近づきます。1313662 + 38704 – 2 = 1352364の自由度の場合、t分布は標準の正規分布と区別できなくなります(下の図を参照)。絶対に小さいp値をさらに小さなp値から区別する)。したがって、t分布のテーブルの代わりに、標準正規分布のテーブルを使用できます。

代替テキスト


みんな、答えてくれてありがとう。分析するデータがあります。これにデータを添付する方法を教えてください。たくさんの人に聞いてもらいたいと思います。迅速な返信を期待しています。
ayush biyani

4
え?すでにt統計を計算している質問で、chlはサンプルのRコードを提供しています。これ以上何が欲しいですか?ところで、迅速な返信を期待したり要求したりする権利があるかどうかはわかりません。私たちはあなたが知っているこのために支払われません。
2010年

1
@ayushあなたの前の質問について、私はあなたの質問に対する完全な回答を提供します(IMHO)-次に、コメントオプションの目的ではない別の質問を求めていると思ったときに停止する前に、コメントをフォローアップしました。そのため、質問が理論的な考慮に関連しているか、適用されたデータ分析に関連しているかを明確に述べるか(後者の場合、再現可能な例を示してください)、または質問を分離することをお勧めします。ところで、あなたはまだあなたが有用だと思う答えを受け入れるオプションがあります(繰り返しますが、その後のコメントではなく、元の質問について)。
CHL

2
@ayushああ、あなたに提供された回答に投票しないことを理解しています(十分な担当者はいますが)。
CHL

@ chl-- yeah..even私は私のこの障害を実現し、素朴な素人..いくつかの日のために私をこのout..Considerを指し示すためcome..Thanksに投稿して確認のためにこれを是正しなければならない
アユシュbiyani

10

tznn>30nz

念のため、データセットには25の変数が含まれているので、25のテストを行っていますか?この場合は、タイプIのエラー率が高くならないように、複数の比較を修正する必要があります(このサイトの関連スレッドを参照)。

ところで、Rソフトウェアはあなたが探しているp値を与えます。テーブルに依存する必要はありません:

> x1 <- rnorm(n=38704)
> x2 <- rnorm(n=1313662, mean=.1)
> t.test(x1, x2, var.equal=TRUE)

    Two Sample t-test

data:  x1 and x2 
t = -17.9156, df = 1352364, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.1024183 -0.0822190 
sample estimates:
  mean of x   mean of y 
0.007137404 0.099456039 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.