おそらく、元の母集団の正規性の仮定は制限が厳しすぎて、サンプリング分布に焦点を当てることを忘れてしまう可能性があり、中心の制限定理のおかげで、特に大きなサンプルの場合は、コメントを意味のあるものにするためにこの段落を残しています。
(通常はそうですが)母分散を知らず、代わりに推定子としてサンプル分散を使用している場合、検定を適用することはおそらく良い考えです。プールされた分散を適用する前に、同一の分散の仮定を分散のF検定またはLavene検定でテストする必要があることに注意してください。t
言及したように、サンプルが増加するにつれて、t分布は正規分布に収束します。このクイックRプロットは次のことを示しています。
赤は正規分布のpdfであり、紫は、自由度が最終的にブレンドされるまで自由度が増加するにつれて、分布のpdfの「太い裾」(またはより重い裾)の漸進的な変化を見ることができます通常のプロット。t
したがって、大規模なサンプルではzテストを適用しても大丈夫でしょう。
最初の答えで問題に対処します。Glen_b、OPのサポートに感謝します(解釈の新しい間違いの可能性は完全に私のものです)。
- 正規性仮定の下での分布におけるT統計的フォロー:
1サンプル対2サンプル(ペアおよび非ペア)の式の複雑さは別として、サンプル平均を母平均と比較する場合に焦点を当てた一般的なt統計は次のとおりです。
t検定= X¯- μsn√= X¯- μσ/ n√s2σ2−−−√= X¯- μσ/ n−−√∑nx = 1(X− X¯)2n − 1σ2−−−−−−−−√(1)
バツμσ2
- (1 ) 〜N(1 、0 )
- (1 )s2/ σ2n − 1〜1n − 1χ2n − 1(n − 1 )s2/ σ2〜χ2n − 1
- 分子と分母は独立している必要があります。
t統計〜T (Df= n − 1 )
- 中心極限定理:
サンプルのサイズが増加するにつれて、サンプルのサンプリング分布の正規性に向かう傾向は、母集団が正規でない場合でも分子の正規分布を仮定することを正当化できます。ただし、他の2つの条件(分母のカイ二乗分布と分母からの分子の独立性)には影響しません。
しかし、すべてが失われるわけではありません。この投稿では、分母のカイ分布が満たされない場合でも、Slutzky定理が正規分布への漸近収束をどのようにサポートするかについて説明します。
- ロバストネス:
Sawilowsky SSとBlair RCによる心理学の報告、1992年、Vol。の「人口正規性からの逸脱に対するt検定のロバストネスとタイプIIエラープロパティのより現実的な外観」111、No。2、352-360では、電力およびタイプIのエラーについて、理想的ではない、または「現実世界」(正規ではない)分布をテストしましたが、次の主張が見つかります。これらの実際の分布の一部に対するt検定の誤差は、研究したさまざまな治療条件とサンプルサイズの出力レベルにはほとんど影響がありませんでした。。
「一般的な見方は、(a)サンプルサイズがほぼ等しいか、(b)サンプルである限り、タイプIのエラーに関する限り、独立サンプルt検定は非ガウスの母集団形状に対して適度にロバストであると思われます。サイズはかなり大きく(Boneau、1960、25〜30のサンプルサイズに言及)、(c)テストは片側ではなく両側です。また、これらの条件が満たされ、公称アルファと実際のアルファの違いが不一致は通常、リベラルな性質ではなく保守的なものです。」
著者は、論争の的となっているトピックの側面を強調しており、Harrell教授が言及したように、対数正規分布に基づいたシミュレーションに取り組むことを楽しみにしています。また、ノンパラメトリック法(例:Mann–Whitney U test)とのモンテカルロ比較をいくつか考えたいと思います。進行中の作業です...
シミュレーション:
免責事項:以下は、「自分自身でそれを証明する」これらの演習の1つです。結果を使用して一般化することはできません(少なくとも私はそうではありません)が、この2つの(おそらく欠陥のある)MCシミュレーションは、状況でのt検定の使用を落胆させないように思えます説明した。
タイプIエラー:
n = 50μ = 0σ= 1
5 %4.5 %
実際、得られたt検定の密度のプロットは、t分布の実際のpdfと重なるように見えました。
最も興味深い部分は、t検定の「分母」、つまり、カイ2乗分布に従うことになっている部分を見たことです。
(n − 1 )s2/ σ2= 98(49(SD2A+ SD2A))/ 98(eσ2− 1 )e2 μ + σ2
ここでは、このウィキペディアのエントリのように、一般的な標準偏差を使用しています。
Sバツ1バツ2= (n1− 1 )S2バツ1+ (n2− 1 )S2バツ2n1+ n2− 2−−−−−−−−−−−−−−−−−−−−−−√
そして、驚くべきことに(またはそうではない)、プロットは重ね合わせたカイ2乗pdfとは非常に異なりました。
タイプIIのエラーと電力:
109
5 %0.024 %99 %
コードはこちらです。