コインを弾くときは、2項式のcdfまたは通常のcdfを使用する必要がありますか?


11

コインは、公平性をテストする必要があります。50フリップした後、30ヘッドがアップします。コインが公正であると仮定すると、50回のフリップで少なくとも30枚のヘッドが得られる確率はどのくらいですか?

私の先生によると、この問題を解決する正しい方法は、

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

しかし、私はこのような二項累積分布関数を取った

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

二項分布の基準は満たされていると思います:個々のイベントは独立しており、考えられる結果は2つ(表と裏)のみで、確率は質問(0.5)に対して一定で、試行回数は50に固定されています。 。しかし、明らかに、2つの方法は異なる答えを出し、シミュレーションは私の答えをサポートします(少なくとも私が実行した数回。明らかに、同じ結果が得られることは保証できません)。

正規分布曲線もこの問題を実行する有効な方法であると仮定して、先生は間違っていますか(分布は正規であるとは言われていませんが、n * pn *(1-p)はどちらも10)、または二項分布について何か誤解しましたか?


5
二項に通常の近似値を使用した経験を持つ人は少し異なる進行する:彼らは(通常の)適用される連続性補正のように、1 - pnorm((30-0.5)/50, mean=0.5, sd=sqrt(0.5*(1-0.5)/50))その値は0.1015である(これはRの表現である)を、二項累積分布関数と非常によく一致して。
whuber

回答:


10

これは、whuberとonestopの回答の図解です。

導通補正

Bin(50,0.5)N(25,12.5)P(Y>29.5)YN(25,12.5)

P(X=k)XBin(50,0.5)P(k12<Y<k+12)P(X30)P(Y>29.5)

P(Y>29.5)0.1015459,
1-pnorm(29.5,25,sqrt(12.5))
P(X30)0.1013194:

これは、連続性補正と呼ばれます。ような「点確率」も計算できます。P(X=22)

P(X=22)=(5022)0.5220.5280.07882567,P(21.5<Y<22.5)0.23975010.16109940.07865066.

4

連続性補正を使用する場合、正規分布は二項式により近い近似を与えます。これをあなたの例に使用すると、0.1015になります。これは宿題なので、詳細を記入するのはあなたにお任せします。


4

このことを考慮。離散二項分布では、個々の数値の実際の確率があります。そうではない連続法線で​​は、値の範囲が必要です。だから...もしあなたが個々の値の確率を概算しようとしているなら、通常の2項式からXとしましょう。正規曲線を重ねた二項分布の確率ヒストグラムを見てください。Xの二項確率が通常の近似であるのと同様のものをキャプチャするには、実際にX±0.5から選択する必要があります。

次に、分布のテールを選択しているときにそれを拡張します。二項法を使用する場合は、値全体の確率(この場合は30)にすべてを加えた確率を選択します。したがって、連続を行う場合は、それを確実にキャプチャし、0.5も少なく選択する必要があるため、連続分布のカットオフは29.5になります。


3
実際、質問は問題の思慮深い理解を示しており、日常的な宿題の質問に対する答えを探しているようには見えません。宿題とタグ付けされていますが、ここで例外を設けることを検討してください。特に、正規分布を使用して離散分布を近似する(Nが大きい2項分布やポアソンなど)の適切な議論が適切であり、ここで最も歓迎されます。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.