私はこの質問を次のように解釈します。サンプリングは、まるで1人の名前のラベルが付けられた枚のホワイトペーパーチケットが瓶に入れられ、瓶の内容物を完全にかき混ぜた後、ランダムに取り出されたとされています。事前に、チケットの枚が赤く着色されていました。チャンスは何である正確に選択されたチケットの二つが赤では?チャンスは何である最大2つのチケットのが赤では?36323212
正確な式を取得できますが、それほど理論的な作業を行う必要はありません。代わりに、チケットがjarからプルされるときのチャンスを追跡します。それらのが取り下げられた時点、正確に赤いチケットが見られた可能性をます。開始するには、(開始する前に赤いチケットを取得することはできません)および(赤いチケットを取得していないことが確実場合ことに注意してください。最初に)。さて、最新の抽選では、チケットは赤か赤かでした。最初のケースでは、以前にが正確にを見る機会がありました。mip(i,m)p(i,0)=0i>0p(0,0)=1p(i−1,m−1)i−1赤いチケット。私たちは、その後、残りの赤1引っ張って、その後起こったそれは正確になって、チケットを、これまでの赤のチケット。すべてのチケットがすべてのステージで等しい確率を持つと想定しているため、この方法で赤を描く可能性はでした。もう1つのケースでは、前のドローで正確に赤チケットを取得する機会あり、次のドローでサンプルに別の赤チケットを追加しない可能性は363−m+1i(12−i+1)/(363−m+1)p(i,m−1)im−1(363−m+1−12+i)/(363−m+1)。そこから、確率の基本公理を使用します(つまり、相互に排他的な2つのケースの確率が加算され、条件付きの確率が乗算されます)。
p(i,m)=p(i−1,m−1)(12−i+1)+p(i,m−1)(363−m+1−12+i)363−m+1.
この計算を再帰的に繰り返し、およびのの値の三角配列をレイアウトします。少し計算すると、および、両方のバージョンの質問に答えます。これらは少数です。どのように見ても、それらはかなりまれなイベントです(1,000に1未満)。0 ≤ I ≤ 12 0 ≤ M ≤ 232 P (2 、232 )≈ 0.000849884 のP (0 、232 )+ P (1 、232 )+ P (2 、232 )≈ 0.000934314p(i,m)0≤i≤120≤m≤232p(2,232)≈0.000849884p(0,232)+p(1,232)+p(2,232)≈0.000934314
再確認として、このエクササイズをコンピューターで1,000,000回実行しました。これらの実験の932 = 0.000932では、2つ以下の赤いチケットが観察されました。期待値934.3のサンプリング変動は約30(上または下)であるため、これは計算結果に非常に近いです。Rでシミュレーションを行う方法は次のとおりです。
> population <- c(rep(1,12), rep(0, 363-12)) # 1 is a "red" indicator
> results <- replicate(10^6,
sum(sample(population, 232))) # Count the reds in 10^6 trials
> sum(results <= 2) # How many trials had 2 or fewer reds?
[1] 948
今回は、実験がランダムであるため、結果は少し異なりました。100万回の試行のうち、948件で2つ以下の赤いチケットが観察されました。それはまだ理論的な結果と一致しています。)
結論として、232チケットのうち2つ以下が赤になる可能性はほとんどありません。 実際に363人の232人のサンプルがある場合、この結果は、jar内チケットモデルがサンプルの取得方法の正しい説明ではないことを強く示しています。 代替説明には、(a)jarから赤いチケットを取得するのがより困難になった(それらに対する「バイアス」)、および(b)サンプルが観察された後にチケットが色付けされた(事後データスヌーピング、ではない)任意のバイアスを示しています。
実例の説明(b)の例は、悪名高い殺人裁判の陪審員プールです。363人が含まれているとします。そのプールから、裁判所はそれらの232をインタビューしました。野心的な新聞記者は、プールの全員の履歴書を綿密にレビューし、363人のうち12人が金魚の愛好家であることに気付きましたが、インタビューを受けたのは2人だけでした。裁判所は金魚愛好家に偏っていますか?おそらく違います。