数20は魔法ですか?


12

データフィッティング分布のサンプルサイズを最小20にすることを検討するようにアドバイスした参考文献があります。

これには意味がありますか?

ありがとう


3
一般的にいや、特定の状況では多分。参考文献があり、目標は何ですか?
image_doctor

1
私は@image_doctorに同意します-20回の観測を最小とみなすべき一般的な理由はありません。非常に特定の状況の場合があります。
Glen_b -Reinstateモニカ

3
単一の値は、そのような分布はポアソンであること(確実に)知られている場合など、いくつかの実用的なケースで動作し、観察が大きい数です。これにより、分布を適合させることができるだけでなく、そのパラメーターの推定値の推定誤差を評価することもできます。
whuber

1
正規分布では、30が経験則であることも読んだと思います。私には、30自由度のスチューデントのtが正常にどれだけ近いかに関係しているようです。しかし、それは単なる経験則です。の値と同じ意味での魔法ではありません。e
ウェイン

1
はい、20は魔法の数字です:en.wikipedia.org/wiki/Magic_number_%28physics%29
Bitwise

回答:


13

これの多くは予想される分布とあなたの研究の質問に依存します。経験則として、経験則に注意する必要があります。予想される分布がわかっている場合は、さまざまなサイズのシミュレーションをいくつか実行し、サンプルシミュレーションが実際の分布を反映する頻度を決定します。これにより、最終的に必要なサンプルサイズとしていくつかのガイダンスが得られます。


極端で独断的な発言を避けて操縦する場合は+1。
whuber

1
「経験則として、経験則に注意する必要があります」ため、+ 1
ヴォルフガング

7

サンプルサイズのマジックナンバーは1,000だと思いました。これは、約3%の誤差を生成するために、ほとんどの米国の国民の世論調査が持っているものです:

z0.9750.50.5/1000=1.960.158=0.031
実際には、有効サンプルサイズは3.7%の誤差につながる、より多くのような700又はそう起因選択および非応答調整の不均等な確率1,000よりも低いです。

わずか20の観測値で、技術的に非常に高い歪度と尖度(もちろん、サンプルの標準偏差で正規化)を 取得できません モーメント法で分布を近似する場合、1に相当する典型的なログの分散をもつ対数正規分布とは当てはまらないことは明らかです(中高所得の不平等国、米国、ブラジル、南アフリカ、ロシアでは、111の驚くほど大きな尖度があるため、すべての対数所得の分散が高くなります。もちろん、モーメント法で対数正規分布に適合させるのはばかげていますが、実世界の分布が20個の観測で説明できるものよりも複雑になる可能性があります。

|skewness|n2n1=4.58,|kurtosis|n23n+3n1=18.05.

分布フィッティング上の別のビューをカーネル密度推定により採取することができる:サイズのサンプルについて最も人気のあるルールは、帯域幅が得られる H = 1.06 σ N - 1 / 5 = 0.58n=20 効果的に全体の分布にまたがりますガウスカーネルを使用します。言い換えれば、サイズ20のほとんどのサンプルは、顕著な尖度を明確に持たない限り、カーネル密度推定を実行すると正常に見えます(つまり、カーネル密度に個別のバンプとして現れるいくつかの外れた観測があることを意味します)プロット)。

h=1.06σ^n1/5=0.58σ^

mss/m3+s/m2202

1
サンプルサイズとして1000を使用する場合の「パワーオブテンシンドローム」への必須リンク(プログラミングに関連する統計のコンテキスト内ですが、他の場所に適用されます):zedshaw.com/essays/programmer_stats.html
Gary Sウィーバー

1
@whuber、あなたはあまりにも賢く、犯罪はありません。ほとんどの人は、あなたがやったようにパラメトリックな仮定を通してではなく、データの瞬間として歪度を計算します。さて、「モーメント法によりピアソン分布を近似している」と言ったら、この議論は関係があるでしょうか?
StasK

はい、多くの場合に関連します。あなたの提案に従って、モーメント法を使用して対数正規分布を近似し、大きな歪度を取得しました。これは、最初の2つの瞬間のみを一致させ、3番目の瞬間を一致させるためです。任意の大きな3次モーメントを許容する2つ以下のパラメーターの分布ファミリーで同じ手順を実行すると、同じ現象が発生すると思います。3つ以上のパラメーターを持つPearsonファミリーでは、経験的な歪度を一致させようとするため、その値が制限されます。
whuber

2

いや。リモートではありません。

このように考えてみてください:10次元の空間(人類)があり、どんな方法(20人)でも20個のサンプルを引き出した場合、それらの情報を使用して、地球上のすべての人を合理的に理解できますか?リモートではありません。天の川銀河には1000億個の星があります。(ランダムに)20個を選ぶことで、銀河天文学のすべてを理解できますか?ありえない。

1次元空間には、いくつかのヒューリスティックがあり、ほとんどの場合有効な経験則が役立ちます。これは、取得する測定の数を示します。それらにはさまざまな程度の有用性と正当化が含まれますが、ある意味では「20」よりも防御力があります。それらには、「近似方程式の変数ごとに5つの測定」、「ガウス密度関数の少なくとも35サンプル」、および「二項関数の少なくとも300サンプル」が含まれます。私のようなオタク爆撃機ではなく実際の統計学者は、特定の信頼区間と第一原理からの不確実性を計算機なしで関連付けることができます。

a3r3+a2r2+a1r+a0a1r+a0dr

「最高」は「良さの尺度」を持たない無意味なアイデアであることを忘れないでください。最適なパスは何ですか?あなたが運命に行くなら、おそらく非常に長くて楽しいものです。自分のcor冠式に行く場合は、短くて壮大なものかもしれません。砂漠を通って歩いているなら、涼しい日陰のものです。「最適な」サンプル数とは何ですか?それはあなたの問題に驚くほど依存しているので、その前に権威で答えられ始めることはできません。それらのすべて?できるだけ多くですか?それらは少しだけ意味があります。はい、それは部分的に死んでいるか妊娠しているようなものです。部分的に無意味であることは、非常に不十分な問題の結果です。

飛行機の気流を正確に予測しようとしていますか?ボールパークに入るには、数百万の測定が必要になる場合があります。自分の身長を知りたい場合は、1人か2人が仕事をするかもしれません。

これは、「空間を広げる」および「パラメータ推定値の分散を最小化する場所でサンプリングする」という重要な点をもたらしませんが、質問は、新入生レベルの答えが関連することを示唆しました。これらのことは、実装する前に問題の性質についてもっと知る必要があります。

注:提案ごとに改善するために編集されました。


1
あなたは質問の「最小」を「最大」または「十分」と読んだようです。あなたが書いたものは、最低20の経験則と矛盾するようには見えません。
whuber

2
@whuber、私は余分な測定が高価だと思う人々の間で働いており、「最小サンプル数」を提供しても、潜在的なサンプル数がそれ以上の不平等とは考えません。彼らはそれを、コストを最小化する最適化問題の境界と考え、その値のみで動作するように努めます。それは私の環境の産物です。
EngrStudent-モニカの復活2013年

1

おそらく、t検定またはANOVARを実行しているコンテキスト(基本的な統計アプリケーションではかなり一般的なコンテキスト)については、各グループの平均がほぼ信頼できるようにするために各グループに必要なサンプルサイズの前後です。分布が多かれ少なかれユニモーダルで極端なピークではないと想定できる場合、(中央極限定理に従って)通常分布します。ラウンド数であるため、19または21ではありません。


0

主題に関するいくつかの記事については、ラスレンズの検出力とサンプルサイズのページを確認してください(ページ中央のアドバイスセクション)。

サンプルに含まれる個人の最小数は、母集団のサイズ、ディメンションの数(データをカテゴリに分けている場合)、および測定(サンプルの個人について継続的な測定を行っている場合)、サイズユニバース、使用する分析手法(これは非常に重要なポイントです-手法は研究の計画中または実験計画中に定義され、決して後ではありません)、および以前の研究で示された複雑さ。

そして、「まれな病気」や「実験心理学」(彼の仕事でポパーが定義した精神)の主題以外の真剣な研究には20は十分ではありません。

以下のコメントに基づいて回答を改良します。

そして、確率分布のフィッティングを伴う「まれな病気」や「実験心理学」(彼の研究でポパーが定義した精神)の主題以外の深刻な研究には20は十分ではありません。

そして、いや、あなたは大きなサンプルサイズを得るために人々を中毒し続けるべきではありません。常識とシーケンシャルテストは停止するように命じます。


3
20のサンプルは「本格的な研究には十分ではない」という包括的な声明を出すのは極端すぎると思います。これは、適切なサンプルサイズが目的や母集団などによって異なるという以前のステートメントと矛盾しています。場合によっては、1つの偽造結果が理論全体を殺すのに十分です。
whuber

1
ケーススタディと定性的研究は、1〜5人の参加者でうまくいくことができます。
Behacad

OK、「ケーススタディ」と「フォーカスグループ」をリストに追加します。
ルーカスガリンド

4
その後、天文学、医学、生物学、化学などを追加する必要がありました。言い換えれば、20が「十分ではない」と主張することは、それが十分であると主張することと同じくらい悪いことです。実際、それはおそらくもっと悪いです。栄養補助食品を投与された最初の8人の被験者が予期しない副作用で死亡した食品安全性試験を想像してください。「20では不十分です」という声明に基づいて、継続的なテストを推奨しますか?
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.