二項分布の正規近似について説明しているほぼすべての教科書は、および場合に近似を使用できるという経験則に言及しています。一部の書籍では、代わりにをます。同じ定数は、 -testでセルをマージするタイミングの説明によく現れます。私が見つけたテキストはどれも、この経験則の正当化または参照を提供していません。N (1 - P )≥ 5 N P (1 - P )≥ 5 5 χ 2
この定数5はどこから来たのですか?なぜ4または6または10ではないのですか?この経験則はもともとどこに導入されたのですか?
二項分布の正規近似について説明しているほぼすべての教科書は、および場合に近似を使用できるという経験則に言及しています。一部の書籍では、代わりにをます。同じ定数は、 -testでセルをマージするタイミングの説明によく現れます。私が見つけたテキストはどれも、この経験則の正当化または参照を提供していません。N (1 - P )≥ 5 N P (1 - P )≥ 5 5 χ 2
この定数5はどこから来たのですか?なぜ4または6または10ではないのですか?この経験則はもともとどこに導入されたのですか?
回答:
二項分布に関するWikipediaの記事の「正規近似」のセクションでいくつかの可能性が提供されています。現在、次のコメントが含まれています(強調鉱山):
もう1つの一般的に使用されるルールは、と両方の値が5より大きい必要があることです。ただし、特定の数はsourceによって異なり、必要な近似の程度によって異なります。n (1 − p )
ここで、これは、正規近似が二項変数の法的範囲内に収まるようにすることと関連付けられています。のx ∈ [ 0 、N ]
私たちが必要なパラメータ化ならば、このうちのスペルを包含確率をという点でのzスコア 、そして我々が持っている 二項モーメントおよびと、上記の制約には必要です したがって、このアプローチでは、はカバレッジ確率に対応します ここで、は標準の通常のCDFですμ ± Z σ ∈ [ 0 、N ] μ=NP σ 2 =NP(1-P)分
したがって、このカバレッジの確率が「かなり」であり、5が適切なラウンド数であるという点で... 私は確率テキストについての経験があまりないので、ウィキペディアの言い回しを使用するために、「5」が他の「特定の数」に対してどれほど一般的であるかは言えません。私の感じでは、5について特に特別なことは何もありません。Wikipediaは、9も一般的であることを示唆しています(3の「かなり」のに対応)。
完全な説明ではありませんが、コクラン1952 年報の数学統計「適合度のテスト」(http://www.jstor.org/stable/2236678)、パートII( " に戻るのは興味深いことです。テストの実用的な使用のいくつかの側面 ")、それはフィールドでかなり立派な古代の... ...コクランはテストの理論的基盤の歴史について議論します(ピアソン1900、フィッシャー1922、1924)が触れません次の節までの経験則に基づいて... [強調を追加]
7.最低限の期待。x2は大規模なサンプルでのX2の限定分布として確立されているため、テストのアプリケーションでは、クラスの予想される最小数は10または(一部のライターを含む)5であることが推奨されています。トピックは最近心理学者の間で活発な議論の対象となっています[17]、[18]。番号10と5は任意に選択されたようです。いくつかの調査は、ルールの適切性にいくつかの光を投げかけます。アプローチは、数学的方法またはサンプリング実験のいずれかによって、期待値の一部またはすべてが小さい場合に、X2の正確な分布を調べることでした。
このタイプの作業には時間がかかるため、調査は予想どおり、範囲が狭く、調査は不十分です。したがって、以下に示す推奨事項は、新しい証拠が利用可能になったときに変更が必要になる場合があります。
少し脱線すると、期待が小さい場合のX2の動作を調査するという問題は、適用された統計に関連する問題のクラス全体の例です。アプリケーションでは、理論の一部の仮定が無効であることがわかっている、または強く疑われる状況で、理論の本体の結果を使用することは日常茶飯事です。したがって、文献には、母集団が非正規である場合のt分布と、母集団の回帰が実際に非線形である場合の線形回帰推定のパフォーマンスの調査が含まれています。幸い、アプリケーションの場合、理論の結果は、いくつかの仮定が成り立たない場合でも、実質的に真のままになることがあります。この事実は、統計を純粋な数学よりも混乱させる主題にする傾向があります、
すでに投稿されている優れた回答に加えて、さまざまなおよび値の観測された比率の分布を調査する視覚化が役立つと思いました。
以下のヒストグラムを生成するために、ベルヌーイ試行からサンプルを確率で取得し、このプロセスを10,000回繰り返しました。次に、これらの10,000回の実験のそれぞれから観測された比率のヒストグラムを生成しました。
視覚的に言えば、はかなり合理的です。ただし、場合でも、およびでいくつかのクリッピングが発生しているようです。あなたが取得すると、インパクトはかなり小さなようです。
また、これらのプロットは、新しい値を取った場合に対称になることに注意してください。
プロットを生成するPythonコード。自分で実験したい場合は、これを使用してとを微調整できます。
import matplotlib.pyplot as plt
import numpy as np
np.random.seed(20190915)
def make_hists(axs, n):
proportions = np.linspace(0.01, 0.19, len(axs))
for i, prop in enumerate(proportions):
# Draw n samples 10,000 times
x = np.random.rand(n, 10_000) < prop
means = x.mean(axis=0)
axs[i].hist(means, bins=np.linspace(0, 0.5, n//2))
axs[i].set_xlim([0, 0.5])
axs[i].set_yticklabels([])
ylim_mean = np.mean(axs[i].get_ylim())
axs[i].text(-0.08, ylim_mean * 3/2, f'$p={prop:.2f}$', va='center')
axs[i].text(-0.08, ylim_mean * 2/3, f'$np={n * prop:.1f}$', va='center')
axs[0].set_title(f'$n={n}$')
def main():
f, axs = plt.subplots(10, 2, sharex=True, figsize=(12, 8))
make_hists(axs[:, 0], 50)
make_hists(axs[:, 1], 250)
f.suptitle(
'Histograms of 10,000 sample proportions, varying $p$ and $n$',
fontsize=14
)
plt.show()
main()