t検定の正規性の仮定に関する質問


9

t検定の場合、ほとんどのテキストによれば、母集団データは正規分布しているという仮定があります。なぜだかわかりません。t検定は、標本平均の標本分布が母集団ではなく正規分布であることのみを要求しませんか?

t検定が最終的にサンプリング分布の正規性のみを必要とする場合は、母集団は任意の分布のように見えますか?適切なサンプルサイズがある限り。それは中心極限定理が述べていることではありませんか?

(ここでは1標本または独立標本のt検定を参照しています)


1
ランダム変数としての標本平均は、単一の部分も正常である場合にのみ正常である可能性があります。しかし、あなたは正しい:t検定は漸近的にノンパラメトリック(正規分布なし)ですが、それでも(2標本の状況で)グループ内の分散は類似していて、存在しているはずです。
マイケルM

グループ内の分散が類似しているため、分散の均一性の仮定を参照していますか?もしそうなら、ウェルチのt検定はこれで正しいですか?
Peter Nash

はい、正確に。ウェルチの修正された自由度が無限大になる場合、彼の手順も配布なしになります(ただし、引用が必要です...)。
マイケルM

回答:


9

t検定の場合、ほとんどのテキストによれば、母集団データは正規分布しているという仮定があります。なぜだかわかりません。t検定は、標本平均の標本分布が母集団ではなく正規分布であることのみを要求しませんか?

t統計量は2つの量の比率で構成され、どちらも確率変数です。分子だけではありません。

t統計がt分布を持つためには、標本平均が正規分布を持っている必要はありません。以下も必要です。

  • 分母では、このようなことがその *ss2/σ2χd2

  • 分子と分母が独立していること。

*(の値 - 1サンプル内のどのテストに依存する我々有する)dtd=n1

これら3つのことが実際に当てはまるには、元のデータが通常どおりに配布されている必要があります。

t検定が最終的にサンプリング分布の正規性のみを必要とする場合は、母集団は任意の分布のように見えますか?

しばらくの間、iidを取り上げましょう。CLTが母集団を保持するには、条件に適合する必要があります...-母集団は、CLTが適用される分布を持つ必要があります。CLTが適用されない人口分布があるためです。

適切なサンプルサイズがある限り。それは中心極限定理が述べていることではありませんか?

いいえ、CLTは実際には「妥当なサンプルサイズ」について一言も述べていません。

実際には、有限のサンプルサイズで何が起こるかについては何も述べられていません。

現在、特定のディストリビューションを考えています。これは、CLTが確実に適用されるものです。しかし、では、標本平均の分布は明らかに非正規です。しかし、人類の歴史のどのサンプルにも、これほど多くの価値があるとは思えません。だから-トートロジーの外で-'合理的な 'はどういう意味ですか?n=1015n


したがって、双子の問題があります:

A.人々が通常CLTに帰する効果-サンプルサイズの分布の正規性への近づきつつあるアプローチは、サンプルサイズが小さい/中程度である-は実際にはCLTに記載されていません**。

B.「分子内の通常からそれほど遠くないもの」では、t分布を持つ統計を取得するには不十分です。

**(Berry-Esseenの定理のようなものは、サンプルサイズの増加がサンプル平均の分布に及ぼす影響を見るときに人々が見ているものに似ています。)


CLTとSlutskyの定理により、として、t統計量の分布が標準正規に近づくことが(すべての仮定が満たされる限り)与えられます。与えられた有限のが何らかの目的で十分であるかどうかは述べていません。nn


1
これらの3つのこと(サンプル平均の正規性、サンプル分散のカイ2乗性、および2つの独立性)を実際に真にするためには、元のデータが正規分布している必要があります。ノーマルだけがこれらの3つの特性を持っていると言っていますか?私はその発言が偽であると主張しているわけではありません。
Andrew M

2
@AndrewM確かにノーマルだけが3つすべてを一緒に持っています。さらに、1番目または3番目だけで法線を暗示するのに十分です-3番目は法線を特徴付けます(Lukacs、1942)、有限数の独立確率変数の場合、法線のみが最初のものを持ちます(Cramérの分解定理)。2番目を取得する方法は他にもあると考えられますが、私はその方法を知りません。
Glen_b-2015

@AndrewM 2番目の点に関しては、Ahsanullah(1987,1989)の研究が関連している可能性があります。
Glen_b-2015

1
それらの参照@Glen_bをありがとう!私はLukacsの結果を認識していませんでした。前述のクレイマーの分解定理は、頭頂部にあるバージョンよりも強力です(すべての行列について、ノーマルIFFノーマル)。XAXA
Andrew M

@AndrewM違いは、Cramerの結果が依存しているのに対して、引用した結果が独立に依存していないことです。どちらも代わりに便利です。
Glen_b-2015
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.