誕生日の質問に対する本当の答えは何ですか?


13

「同じ誕生日を持つ2人を見つける確率を少なくとも50%にするために、クラスはどれくらい大きくなければならないのか?」

Facebookには360人の友人がいますが、予想どおり、誕生日の分布はまったく均一ではありません。ある日、同じ誕生日の友人が9人います。(大きな祝日の9か月後、バレンタインデーは大きな祝日だと思われます、笑)。だから、いくつかの日は誕生日の可能性が高いことを考えると、23の数が上限だと思います。

この問題に対するより良い推定がありましたか?


3
360人のサンプルでは、​​1年の365日間の誕生日の分布の大きなサンプルは作成されません...このような小さなサンプルの均一性を確認することはできません。
西安

人には誕生日がありますが、2人目の人同じ誕生日を共有しない確率はどのくらいですか?364/365、第三者どちらの誕生日共有しない確率はどのくらいですか?(364/365) * (363/365)。確率が得られるまでこれを展開します< 50%も同じ誕生日を持たないというオッズを意味します> 50%。つまり、少なくとも2人が誕生日を共有するオッズはになるということです。
zzzzBov

8
ランダムな友達がいると思いますか?
ジェームズ

1
@zzzzBov-OPが何を求めているのか理解できません。これは、我々がチャンスでそれぞれ、それぞれの誕生日が同じ確率であると仮定したアプローチであるであることあなたの。OPは1月1日に生まれて言うとどうなるか見積もりを求めていることなどおそらく2月15日生まれされないようである1365
probabilityislogic

回答:


18

幸運なことに、誰かが関連する質問について少し議論した上で、本物の誕生日データを投稿しました(配布の均一性です)。私たちはこれとリサンプリングを使用して、あなたの質問に対する答えが明らかに23- 理論的な答えと同じであることを示すことができます。

> x <- read.table("bdata.txt", header=T)
> birthday <- data.frame(date=as.factor(x$date), count=x$count)
> summary(birthday) 
      date         count     
 101    :  1   Min.   : 325  
 102    :  1   1st Qu.:1266  
 103    :  1   Median :1310  
 104    :  1   Mean   :1314  
 105    :  1   3rd Qu.:1362  
 106    :  1   Max.   :1559  
 (Other):360                 
> results <- rep(0,50)
> reps <-2000 # big number needed as there is some instability otherwise
> for (i in 1:50)
+ {
+ count <- 0
+ for (j in 1:reps)
+ {
+ samp <- sample(birthday$date, i, replace=T, prob=birthday$count)
+ count <- count + 1*(max(table(samp))>1)
+ }
+ results[i] <- count/reps
+ }
> results
 [1] 0.0000 0.0045 0.0095 0.0220 0.0210 0.0395 0.0570 0.0835 0.0890 0.1165
[11] 0.1480 0.1770 0.1955 0.2265 0.2490 0.2735 0.3105 0.3350 0.3910 0.4165
[21] 0.4690 0.4560 0.5210 0.5310 0.5745 0.5975 0.6240 0.6430 0.6950 0.7015
[31] 0.7285 0.7510 0.7690 0.8025 0.8225 0.8280 0.8525 0.8645 0.8685 0.8830
[41] 0.8965 0.9020 0.9240 0.9435 0.9350 0.9465 0.9545 0.9655 0.9600 0.9665

8
実際、一つを介して表示することができシューア凸の場合と、任意の誕生日の不均一な分布、一致の確率が均一の場合のように大きなとして少なくともあります。これは、J。マイケル・スティールの演習13.7コーシー・シュワルツのマスタークラス:数学の不等式の紹介、ケンブリッジ大学出版局、2004年、pg。206
枢機卿

2
@西安:確かに。今、もし私が高品質で読者の多い統計雑誌の書評を行った人を知っていたら、統計学者により高い可視性を与えるためにそれをレビューすることをお勧めします...しかしそのような人をどこで見つけるか...
枢機

3
(私の直前のコメントについて疑問に思うかもしれ人のために、それは西安@新たに任命されたという事実参照するためのブックレビューアチャンスを。)
枢機卿

2
@ Xi'an、これをチェックして、あなたの考えを見てください:table(replicate(10^5, max(tabulate(sample(1:365,360,rep=TRUE)))))
whuber

3
R cognoscentiを除いて、@ Xi'anと私自身による以前のコメントのコードがOPの状況をシミュレートしていることはおそらく明らかではありません。実行すると、均一に分散した人口からランダムに選択された360人のうち9人以上が誕生日を共有する可能性は、100,000人のうち約40人にすぎません。共有誕生日の最大数の最も可能性の高い値は5です
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.