うるう日に生まれる確率は?


31

今日がうるう日であることを考えると、だれかがうるう日に生まれる確率を知っていますか?


30
出生は一年中均一に分布していないため、ランダムに選択された日がうるう日である確率は、1日に生まれる確率と同じではないことに注意してください。
ベンミルウッド

17
うち生まれて?歴史上のすべての人々?今日?すべての人が生きていますか?将来に向けて?参照するイベントが明確に定義されていない限り、確率は無意味です。
whuber

15
今日生まれる人は100%になります。それは役立ちますか?
アスラム

8
多くの親は、うるう日に子供が生まれることを望みません。そのため、スケジュールされたCセクションの増加により、確率はランダムな日よりも低くなります。fivethirtyeight.com/features/...
ジェームズLawruk

3
私は、@ whuberに同意します。質問は不明確です。確率空間を適切に定義しないと、質問に答えることができません。したがって、下票。
mpiktas

回答:


24

確かに。詳細な説明については、http//www.public.iastate.edu/~mlamias/LeapYear.pdfを参照してください

しかし本質的に著者は、「2千年には485うるう年があります。したがって、2千年には、合計日があります。それら(うるう年)の485は、その確率は485 / 730485 = 0.0006639424485(366)+(2000485)(365)=730485485/730485=0.0006639424


9
なぜ1 /(4年間の日数)= 1/1461 = 0.00068として計算できないのですか?
シッデシュ

21
@Siddhesh何世紀にもわたってルールがあります。だから、例えば2100年には、うるう年ではありません
Rentrop

8
@Siddhesh、残念ながら、それほど単純ではありません。うるう年はもう少し複雑です。平均的な年の長さは、実際には、365.25ではなく365.2425日です。ウィキペディアのうるう年のページに書かれているように、「グレゴリオ暦…は、うるう周期の長さである400年ごとに3うるう日を削除します。これは、3世紀の2月29日(100の倍数) [3] 2000年と2400年はうるう年であり、1800年、1900年、2100年、2200年、2300年、2500年は一般的な年です。」
StatsStudent

10
なぜ2000年を考慮する必要があるのか​​わかりません。うるう年は400年周期であるため、「400年には97のうるう年がある」だけに減らさないのはなぜですか。
フィリップケンドール

7
世紀の「キャンセル」うるう日などのマイナーな影響を400の倍数ではなく、2月29日までにほぼすべての出生が遅延または導入されるなどの外部の影響を考慮しない理由不便(または他の理由)から子供?-少なくともドイツでは、2月29日に出生する確率はほぼゼロです(推定)。
私はモニカと一緒に

23

統計を使用してその確率を正確に予測するには、出生がどこで発生したかを知ることが役立ちます。

このページhttp://chmullig.com/2012/06/births-by-day-of-year/には、1日あたりの出生数のサブセットを示すグラフがあります(29日に4を掛け、これは正しくなく、望ましくありません)この質問に対しては、元のデータへのリンクもあり、米国で期待できることの大まかな目安を提供します。この曲線は他の国、特に他の大陸では当てはまらないと思います。特に、気候が決定要因であると仮定すると、南半球と赤道地域はこれらの結果からかなりの派生を示すかもしれません。

さらに、「選択的誕生」の問題があります(http://bmjopen.bmj.com/content/3/8/e002920.fullの著者が触れました)-世界のより貧しい地域では、 (非緊急)帝王切開または出産が先進国よりも少ないため、出生の分布。これは、出生の最終的な分布をゆがめます。

アメリカのデータを使用して、約7100万の出生(グラフ化された平均* 366)と2月29日の46.000の出生を想定し、データのうるう年の分布を修正せず、正確な期間が示されていないため、 〜0.000648前後。これは、出生の分布が平坦な場合に予想される値よりもわずかに低いため、グラフによって与えられる一般的な印象と一致しています。

この大まかな見積もりの​​有意性テストは、やる気のある読者にお任せします。しかし、29日(未修正-2000年はデータに平均以下のバイアスを注入します)が既に低い2月の標準であっても低いスコアを与えられていることを考えると、等しい分布のヌル仮説が拒否される可能性が比較的高いと思います。


1
データセットには2月30日と31日の生年月日があります。それは面白い。分析の前に適切にクリーンアップする必要がありますが、多くのデータがあり、素晴らしいです。
アクサカル

22

この質問に対する答えは経験的なものに過ぎないと思います。理論上の答えは、誕生日の選択現象や季節性などを考慮せずに欠陥があります。これらのことを理論的に扱うことは不可能です。

米国では、プライバシー上の理由から誕生日データを見つけるのは困難です。ここには 1つの匿名データセットがあります。これは、米国の保険申請からのものです。よく引用されるよくあるNYTの記事など、他のレポートとの違いは、年ごとの単純なランキングではなく、日付ごとの出生頻度をリストしていることです。保険から来るので、弱点はもちろんサンプリングの偏りです:被保険者は含まれていません等。

データによると、総481040.の2月29日に325人の出生のに応じてあったロイマーフィーサンプルスパンは1981年から1994年を通して、それは総14年の3うるう年を含みます。調整を行わないと、1981年から1994年の2月29日に生まれる確率は0.0675%になります。

あなたは(1/4に近いうるう年の周波数、を考慮することにより確率を調整することができない、正確にいえにより、この数を乗じて、例えば) 0.079パーセントの見積もりに到着します。ここで、うるう年の2月29日に生まれる条件付き確率pは、観測された頻度F o =14/12p周波数によって F L = 3のサンプルでうるう年の: F 、O = F L / N F p ここで N = 14Fo=325fL=3

Fo=fL/NFp,
N=14はサンプルの年数で、は出生の合計頻度です。F=481040

通常は、うるう年の確率は、それ故に、長期平均確率 P L 2月29日に生まれているのである: P L = PのLP のP LNpL1/4PL

PL=pLppLNfLFoF0.079%

うるう年に生まれた場合、2月29日に生まれる条件付き確率に興味があるかもしれません: p = Np

p=NfLFoF0.32%

PLp

もちろん、この議論は米国中心でした。他の国のパターンを知っている人。

更新:OPはグレゴリオ暦であると自動的に仮定しました。うるう年が約30年ごとである太陰暦Hijriなどのさまざまなカレンダーを検討すると、さらに興味深いものになります。

更新2:

pFp=1,527Amitabh Chandra, Harvard University

さて、グレゴリオ暦の非常に奇妙な日、1月1日、12月25日、およびDeb 29日は、最も人気のある誕生日としてランダムに来るでしょうか?ランダムに発生する可能性は非常に低いと言います。したがって、イスラム教などの他のカレンダーで何が起こっているのかを見るのはさらに面白いです。

更新3:

PL,p

p^1/3660.27
P^Lp3663654+10.068

更新4:

χ2

14365+3

d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs

idL = 60; % index of Feb 29

% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days

fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;

fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))

% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on

% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)

出力:

non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000

h =

     1


p =

     0

ここに画像の説明を入力してください


3
便利な分析です(+1)。分析する頻度と、質問で求められた(あいまいに定義された)確率との間に関係があるのではないかと思います。
whuber

1
@whuber、私の答えの確率は、保険申請やいくつかのユーザーデータの分析のような場合です。たとえば、Webサイトがあり、問題のあるユーザーデータにフラグを立てたいとします。2月29日の誕生日の頻度を私の確率と比較できます。しかし、あなたが家族を計画していてこの質問をしているなら、私の数字はほとんど役に立たない。その理由は、正確にカップルが実際に交尾する時期や出生率、カップルの期間パターンなどの要因を考慮していないためです。これは、誕生日の主な決定要因です。
アクサカル

純粋な統計を超えて、他の要因を検討する前に数学から始めなかったことを嬉しく思います
-TheBlastOne

8

私のお気に入りの本の表紙は、出生の日付への均一な配分の仮定に対するいくつかの非常に関連性のある証拠を提供しています。具体的には、1970年以降の米国での出生には、複数の10年の傾向、非周期的な傾向、曜日の傾向、年の傾向、休日の傾向(Cesareanなどの手順のため)セクションでは、生年月日を効果的にスケジュールすることができ、医師は休日にそれらを行わないことがよくあります)。その結果、1年のうち無作為に選ばれた日に生まれる確率は一様ではなく、出生率は年ごとに異なるため、すべての年が同じように発生するわけではありません。

これは、Asksalのソリューションが非常に強力な候補である一方で、不完全であることの証拠も提供します。少数のうるう日は、ここで遊んでいるすべての効果によって「汚染」されるため、Asksalの推定値は、2月29日とともに、曜日と長期の傾向の影響捕捉しています(偶然)。効果。どの効果を含めるのが適切であるかは、質問によって明確に定義されていません。

そして、この分析は、他の国や人口とはかなり異なるかもしれない人口統計学的傾向がある米国にのみ関係しています。たとえば、日本の出生率は何十年もの間低下しています。中国の出生率は国家によって規制されており、その国の性別構成とそれに続く世代の出生率にいくつかの影響があります。

同様に、Gelmanの分析は最近の数十年についてのみ説明しており、これがあなたの質問にとって興味のある時代であることも必ずしも明確ではありません。

ここに画像の説明を入力してください

この種のことに興奮する人のために、カバーの資料はガウス過程の章で詳細に議論されています。


2
ここにブログの記事でも利用可能に使用されるモデルの簡単な説明:andrewgelman.com/2012/06/19/...
サカリCajanus

3

2月29日は、毎年発生する日付の4の倍数です

ただし、100の倍数であるが400の年ではない年は、うるう年とは見なされません(たとえば、1900はうるう年ではありませんが、2000または1600はうるう年ではありません)。したがって、今日では、400年ごとに同じパターンです。

それでは、[0; 400 [間隔で計算を行いましょう:

400年の期間では、4の倍数である正確に4 x 25 = 100年があります。しかし、100 から3(100の倍数で、400の倍数ではない)を引く必要があり、100-3 = 97になります。年になります。

ここで97に366を掛ける必要があり、97 x 366 = 35502(400年のうるう年の日数)のままです(365 x(400-97))= 110 595(ない日数) tは、400年のうるう年になります)。

次に、400年の期間の合計日数を知るために、これら2つの数値を追加する必要があります。110595 + 35502 = 146 097ます。

最後に、私たちの確率は400年の期間の2月29日の数なので、97のうるう年が間隔の合計日数で割られている場合、97です。

p = 97/146097≈0,0006639424492

これが正しいことを願っています。


7
これは、ランダムに選択された日付が2月29日になる可能性の良い分析です。このスレッドでの議論のほとんどは、実際には出生の可能性についての質問に答えていないという事実に焦点を当てていると思います。
whuber

1
もっと簡単な方法は、あなたがすでに解決した方法と同じように、400年ごとに97うるう年があると言うことです。通常の400年の日数を計算します。400 * 365 =146000。その後、146097を与える97のうるう日を追加する必要があります。
CJデニス

2

ここには2つの質問があると思います。1つは、「特定の日が2月29日である確率はどのくらいですか?」です。2つ目は(そして実際に尋ねられたものは)「うるう日に生まれる確率はいくらですか?」です。

Aksakalが指摘しているように、単に日数を数えるアプローチは誤解を招くようです。2月29日の日数を数え、頻度を計算すると、「特定の日が2月29日である確率はどれくらいですか?」という質問に対処します。(com睡状態の後に目覚めることを想像してください。何の日かはわかりません。2月29日である可能性は上記で指摘したとおりです。p=97146097000066394)。

Aksakalの答えに続いて、確率は、年間の出産の分布に関する経験的研究に基づいているだけです。データセットが異なると、結論も異なります(季節性の影響、出生率の長期的な傾向、文化の違いなど)。Aksakalは研究を指摘しました(1つのコメント:言及されたデータのin年の非代表的な発生を説明するために(すなわち、314)le年の長期的な頻度と比較して 97400)サンプルから2月29日に出生頻度を掛ける必要があります 97400143=6796001.131667)。

最後に、質問の3番目の可能な解釈がありますが、これは意図していなかったと思います:「特定の人がうるう日に生まれる確率は?」まあ、すでに生まれた人にとっては簡単です。どちらか0 または 1。生まれていないがすでに妊娠している人については、妊娠期間に関する経験的研究を使用して推定することもできます(概要については、ウィキペディアを参照してください)。まだ考えていない人は、上記を参照してください。


2
えーと、私はこれを投票する準備ができていたので、それから私はウェルに着きました0または1のいずれかです。いいえ。
mattdm

これは、確率の解釈に少し左右されると思います。コインを投げたと仮定します。私はそれを見て、その結果(頭など)を知っています。あなたは私の隣に立っていますが、結果を見ていません。コインが頭を表示する確率はどれくらいですか(あなたにとって、私にとっては、「客観的に」)。上記の例では、与えられた(生まれた)人の確率は0または1です(彼が生まれた日付を知っていると仮定)。ランダムに人を選んで、彼の誕生日を推測しなければならなかった場合、それが2月29日である確率は再び経験的な問題です。
data_enthusiast

1

上記の答えのほとんどは、特定の期間のうるう日数を計算することでうまくいくことに気付きました。定義により、答えを100%正確に取得するより簡単な方法があります。

うるう年を使用して、通常の(365日)カレンダーを平均熱帯年(平均太陽年)に調整します。平均熱帯年は、「地球から見たとき、太陽が季節のサイクルで同じ位置に戻るのにかかる時間」(ウィキペディア)です。熱帯年はわずかに異なりますが、平均(平均)熱帯年は365.24667についてです。

うるう日が正しい場合、ランダムに選択された日がうるう日である可能性は、((熱帯年)-(非うるう年))/熱帯年

おおよその数を差し込むと、(365.24667-365)/365.24667、または0.24667 / 365.24667、または100万分の675(0.0675%)です。

ただし、これはランダムに選択された日です。これは、「実際の誕生日は4年に1回しか来ない」と子供に説明する必要がない両親によってかなり歪められていると思います。


3
2月29 うるう日は特定のカレンダーシステムにのみ存在するため、これは質問に答えるとは思わない。これらのカレンダーシステムは、最近の歴史的な時代に特定の社会でのみ使用されてきました。たとえば、この質問は、「2月」のないヘブライ暦を使用して時間を計算する人にはわかりません。さらに、うるう日を含むカレンダーを想定しても、出生の確率分布を取り巻く不確定性はまだ解決されません。
Sycoraxが復活モニカ言う

@ user777、それは無関係です。うるう日を認識しない文化に属している場合でもうるう日に生まれた人がいます
タコ

1
@Octopusグレゴリオ暦が導入された1582年10月より前に生まれた場合は別です。質問は、どの人口が考慮されているかを見分けることができるほど具体的ではないため、私のコメントは非常に重要です。
シコラックスは、モニカの復活を

@ user777、あなたは髪を分割しています。重要なのは、グレゴリオ暦が今日存在していることであり、グレゴリオ暦をその日に観察したかどうかに関係なく、履歴に毎日配置するために使用できます。
タコ

1
@Octopusそれがポイントだとどうしてわかるの?
シコラックスは、モニカを

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.