30を十分な大きさのサンプルサイズとして使用することをサポートするには、どの参考文献を引用する必要がありますか


41

少なくとも30単位のサンプルサイズが「大きなサンプル」と見なされることを何度も読んだり聞いたりしました(通常、CLTにより平均値の正規性の仮定が成り立つ...)。したがって、私の実験では、通常30ユニットのサンプルを生成します。サンプルサイズ30を使用する際に引用する必要がある参考資料を教えてください。


2
推定しようとするパラメーターの数、または同等に作業しているモデルの種類を参照せずに、明確な答えを出すのはかなり難しいようです。
chl

2
小規模および大規模サンプルの境界としてのn = 30の受け入れは、統計的手法では十分にサポートされていません。
ジボル

回答:


37

小さいサンプルと大きいサンプルの境界に対するn = 30 の選択は、経験則にすぎません。たとえば、Hogg and Tanisの確率と統計的推論(7e)が「25または30を超える」と言っているこの値を引用する書籍が多数あります。

そうは言っても、30が良い境界と見なされた唯一の理由は、教科書の裏にあるかなりのスチューデントのtテーブルが1ページにうまく収まるようになったからだということです。それと、臨界値(スチューデントのtと法線の間)は、df = 30からdf =無限までとにかく、およそ0.25までしかオフになりません。手計算では、違いは実際には重要ではありませんでした。

今日では、あらゆる種類の重要な値を小数点以下15桁まで簡単に計算できます。その上、リサンプリングと置換の方法がありますが、これらの方法はパラメトリックな母集団の分布に制限されていません。

実際には、n = 30に依存することはありません。データをプロットします。必要に応じて、正規分布を重ね合わせます。通常の近似が適切かどうかを視覚的に評価します(さらに、近似が本当に必要かどうかを尋ねます)。研究用のサンプルと近似値の生成が必須である場合、近似値を必要に応じて(または計算上実行可能な範囲で)近づけるのに十分なサンプルサイズを生成します。


13
これは、n = 30の場合のt分布の正規近似の正確さに関するページです。 johndcook.com/normal_approx_to_t.html
ジョンD.クック

41

実際、「マジックナンバー」30は誤りです。JacobのCohenの楽しい論文「私が学んだこと(これまで)」(Am。Psych。December 1990 45#12、pp 1304-1312)を参照してください。この神話は、「あなたが学ぶことはそうではない」という彼の最初の例です。

[O]私の仲間の博士候補者のうちの1人が、グループごとにわずか20例のサンプルで論文を引き受けました。... [L] ater私は、2つの独立したグループ平均を比較し、両側レベルでグループごとに場合、中規模の効果がラベル付けされる確率によって重要なのは... tテストはたったのでした。このように、実際には効果の大きさには意味がありましたが、重要な結果が得られるかどうかはほぼコインフリップでした。... [私の友人]は、重要ではない結果になりました。それによって、彼は精神分析理論の重要な分野を破壊し始めました。n=30.05.47


2
美しい参照-そして関連のスポット。ありがとうございました。
whuber

1
@whuberどの紙だったか覚えていますか?リンクは今では壊れています。多分これはpsych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf、「私が学んだこと(これまで)」ですか?年は、破損したリンクのURLの年と一致します。
アメーバは、モニカを復活させる

1
@Amoebaこの論文を読んだときに保存したので、あなたが見つけたものが意図したものであることを確認できます。リンクとともに引用を含めるように、この回答を更新しました。
whuber

@Carlos Accioly前のリンクが壊れたため、新しいリンクで更新しました。
Akshay Bansal

9

IMO、それはすべてあなたがあなたのサンプルを使用したいものに依存します。意味を説明するための2つの「愚かな」例:平均を推定する必要がある場合、30の観測で十分です。100個の予測変数を使用して線形回帰を推定する必要がある場合、30個の観測値は十分に近くなりません。


9

ほぼ任意の経験則。このステートメントは、多くの要因に依存します。たとえば、データの分布について。たとえば、データがコーシーからのものである場合、平均値を推定するには30 ^ 30の観測値でも十分ではありません(その場合、を引き起こすには無限の観測値でも十分ではありません収束する)。この数値(30)は、描画する値が互いに独立していない場合も偽です(再び、サンプルサイズに関係なく、収束しないことがあります)。μ¯(n)

より一般的には、CLTを保持するには基本的に2つの柱が必要です。

  1. ランダム変数が独立していること:情報を失うことなく、観測を並べ替えることができます*。
  2. rvは有限の2次モーメントを持つ分布から得られることを意味します。つまり、平均とsdの古典的な推定量は、サンプルサイズが大きくなるにつれて収束する傾向があります。

(これらの条件はどちらも多少弱くなる可能性がありますが、違いは主に理論的な性質です)


6
例は、堅牢な統計の価値を示しています。サンプルの中央値は良くコーシー分布の位置パラメータを推定します。30個のサンプルでt検定を使用する場合の最も弱いリンクは、30個のサンプルではなくt検定であると主張できます。
ジョンD.クック

1
John:>「30個のサンプルでt検定を使用する場合の最も弱いリンクは、30個のサンプルではなくt検定であると主張することができます。」非常に真実であり、データがiidであるという仮定もあります。また、中央値は、Cauchy分布確率変数のMLE(したがって効率的)ですが、一般に30を超える観測が必要になる場合があります。
user603

1
CLTのすべてのバージョンが、まったく同じように配布されていること、さらには独立していることにも依存しているわけではありません。学部生に教えられる基本的なものはしばしばそうしますが、両方の仮定を行わないバージョンがあります。例えば、リアプノフCLTは独立を仮定しますが、同一の分布ではなく、独立条件も緩和できます。その「並べ替え」も独立と同じではありません。依存のいくつかの形式は順序に依存しません。
Glen_b

2
サンプルサイズ50,000は、対数正規分布の平均の信頼区間を計算するのにCLTが十分に機能するには不十分です。
フランクハレル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.