今日がうるう日であることを考えると、だれかがうるう日に生まれる確率を知っていますか?
今日がうるう日であることを考えると、だれかがうるう日に生まれる確率を知っていますか?
回答:
確かに。詳細な説明については、http: //www.public.iastate.edu/~mlamias/LeapYear.pdfを参照してください。
しかし本質的に著者は、「2千年には485うるう年があります。したがって、2千年には、合計日があります。それら(うるう年)の485は、その確率は485 / 730485 = 0.0006639424」
統計を使用してその確率を正確に予測するには、出生がどこで発生したかを知ることが役立ちます。
このページhttp://chmullig.com/2012/06/births-by-day-of-year/には、1日あたりの出生数のサブセットを示すグラフがあります(29日に4を掛け、これは正しくなく、望ましくありません)この質問に対しては、元のデータへのリンクもあり、米国で期待できることの大まかな目安を提供します。この曲線は他の国、特に他の大陸では当てはまらないと思います。特に、気候が決定要因であると仮定すると、南半球と赤道地域はこれらの結果からかなりの派生を示すかもしれません。
さらに、「選択的誕生」の問題があります(http://bmjopen.bmj.com/content/3/8/e002920.fullの著者が触れました)-世界のより貧しい地域では、 (非緊急)帝王切開または出産が先進国よりも少ないため、出生の分布。これは、出生の最終的な分布をゆがめます。
アメリカのデータを使用して、約7100万の出生(グラフ化された平均* 366)と2月29日の46.000の出生を想定し、データのうるう年の分布を修正せず、正確な期間が示されていないため、 〜0.000648前後。これは、出生の分布が平坦な場合に予想される値よりもわずかに低いため、グラフによって与えられる一般的な印象と一致しています。
この大まかな見積もりの有意性テストは、やる気のある読者にお任せします。しかし、29日(未修正-2000年はデータに平均以下のバイアスを注入します)が既に低い2月の標準であっても低いスコアを与えられていることを考えると、等しい分布のヌル仮説が拒否される可能性が比較的高いと思います。
この質問に対する答えは経験的なものに過ぎないと思います。理論上の答えは、誕生日の選択現象や季節性などを考慮せずに欠陥があります。これらのことを理論的に扱うことは不可能です。
米国では、プライバシー上の理由から誕生日データを見つけるのは困難です。ここには 1つの匿名データセットがあります。これは、米国の保険申請からのものです。よく引用されるよくあるNYTの記事など、他のレポートとの違いは、年ごとの単純なランキングではなく、日付ごとの出生頻度をリストしていることです。保険から来るので、弱点はもちろんサンプリングの偏りです:被保険者は含まれていません等。
データによると、総481040.の2月29日に325人の出生のに応じてあったロイマーフィーサンプルスパンは1981年から1994年を通して、それは総14年の3うるう年を含みます。調整を行わないと、1981年から1994年の2月29日に生まれる確率は0.0675%になります。
あなたは(1/4に近いうるう年の周波数、を考慮することにより確率を調整することができない、正確にいえにより、この数を乗じて、例えば) 0.079パーセントの見積もりに到着します。ここで、うるう年の2月29日に生まれる条件付き確率pは、観測された頻度F o =周波数によって F L = 3のサンプルでうるう年の: F 、O = F L / N ⋅ F ⋅ p 、 ここで N = 14
通常は、うるう年の確率は、それ故に、長期平均確率 P L 2月29日に生まれているのである: P L = PのL ⋅ P ≈ のP L ⋅ N
うるう年に生まれた場合、2月29日に生まれる条件付き確率に興味があるかもしれません: p = N
もちろん、この議論は米国中心でした。他の国のパターンを知っている人。
更新:OPはグレゴリオ暦であると自動的に仮定しました。うるう年が約30年ごとである太陰暦Hijriなどのさまざまなカレンダーを検討すると、さらに興味深いものになります。
更新2:
Amitabh Chandra, Harvard University
さて、グレゴリオ暦の非常に奇妙な日、1月1日、12月25日、およびDeb 29日は、最も人気のある誕生日としてランダムに来るでしょうか?ランダムに発生する可能性は非常に低いと言います。したがって、イスラム教などの他のカレンダーで何が起こっているのかを見るのはさらに面白いです。
更新3:
更新4:
d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs
idL = 60; % index of Feb 29
% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days
fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;
fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))
% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on
% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)
出力:
non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000
h =
1
p =
0
私のお気に入りの本の表紙は、出生の日付への均一な配分の仮定に対するいくつかの非常に関連性のある証拠を提供しています。具体的には、1970年以降の米国での出生には、複数の10年の傾向、非周期的な傾向、曜日の傾向、年の傾向、休日の傾向(Cesareanなどの手順のため)セクションでは、生年月日を効果的にスケジュールすることができ、医師は休日にそれらを行わないことがよくあります)。その結果、1年のうち無作為に選ばれた日に生まれる確率は一様ではなく、出生率は年ごとに異なるため、すべての年が同じように発生するわけではありません。
これは、Asksalのソリューションが非常に強力な候補である一方で、不完全であることの証拠も提供します。少数のうるう日は、ここで遊んでいるすべての効果によって「汚染」されるため、Asksalの推定値は、2月29日とともに、曜日と長期の傾向の影響も捕捉しています(偶然)。効果。どの効果を含めるのが適切であるかは、質問によって明確に定義されていません。
そして、この分析は、他の国や人口とはかなり異なるかもしれない人口統計学的傾向がある米国にのみ関係しています。たとえば、日本の出生率は何十年もの間低下しています。中国の出生率は国家によって規制されており、その国の性別構成とそれに続く世代の出生率にいくつかの影響があります。
同様に、Gelmanの分析は最近の数十年についてのみ説明しており、これがあなたの質問にとって興味のある時代であることも必ずしも明確ではありません。
この種のことに興奮する人のために、カバーの資料はガウス過程の章で詳細に議論されています。
2月29日は、毎年発生する日付の4の倍数です。
ただし、100の倍数であるが400の年ではない年は、うるう年とは見なされません(たとえば、1900はうるう年ではありませんが、2000または1600はうるう年ではありません)。したがって、今日では、400年ごとに同じパターンです。
それでは、[0; 400 [間隔で計算を行いましょう:
400年の期間では、4の倍数である正確に4 x 25 = 100年があります。しかし、100 から3(100の倍数で、400の倍数ではない)を引く必要があり、100-3 = 97になります。年になります。
ここで97に366を掛ける必要があり、97 x 366 = 35502(400年のうるう年の日数)のままです(365 x(400-97))= 110 595(ない日数) tは、400年のうるう年になります)。
次に、400年の期間の合計日数を知るために、これら2つの数値を追加する必要があります。110595 + 35502 = 146 097ます。
最後に、私たちの確率は400年の期間の2月29日の数なので、97のうるう年が間隔の合計日数で割られている場合、97です。
p = 97/146097≈0,0006639424492
これが正しいことを願っています。
ここには2つの質問があると思います。1つは、「特定の日が2月29日である確率はどのくらいですか?」です。2つ目は(そして実際に尋ねられたものは)「うるう日に生まれる確率はいくらですか?」です。
Aksakalが指摘しているように、単に日数を数えるアプローチは誤解を招くようです。2月29日の日数を数え、頻度を計算すると、「特定の日が2月29日である確率はどれくらいですか?」という質問に対処します。(com睡状態の後に目覚めることを想像してください。何の日かはわかりません。2月29日である可能性は上記で指摘したとおりです。)。
Aksakalの答えに続いて、確率は、年間の出産の分布に関する経験的研究に基づいているだけです。データセットが異なると、結論も異なります(季節性の影響、出生率の長期的な傾向、文化の違いなど)。Aksakalは研究を指摘しました(1つのコメント:言及されたデータのin年の非代表的な発生を説明するために(すなわち、)le年の長期的な頻度と比較して )サンプルから2月29日に出生頻度を掛ける必要があります )。
最後に、質問の3番目の可能な解釈がありますが、これは意図していなかったと思います:「特定の人がうるう日に生まれる確率は?」まあ、すでに生まれた人にとっては簡単です。どちらか または 。生まれていないがすでに妊娠している人については、妊娠期間に関する経験的研究を使用して推定することもできます(概要については、ウィキペディアを参照してください)。まだ考えていない人は、上記を参照してください。
上記の答えのほとんどは、特定の期間のうるう日数を計算することでうまくいくことに気付きました。定義により、答えを100%正確に取得するより簡単な方法があります。
うるう年を使用して、通常の(365日)カレンダーを平均熱帯年(平均太陽年)に調整します。平均熱帯年は、「地球から見たとき、太陽が季節のサイクルで同じ位置に戻るのにかかる時間」(ウィキペディア)です。熱帯年はわずかに異なりますが、平均(平均)熱帯年は365.24667についてです。
うるう日が正しい場合、ランダムに選択された日がうるう日である可能性は、((熱帯年)-(非うるう年))/熱帯年
おおよその数を差し込むと、(365.24667-365)/365.24667、または0.24667 / 365.24667、または100万分の675(0.0675%)です。
ただし、これはランダムに選択された日です。これは、「実際の誕生日は4年に1回しか来ない」と子供に説明する必要がない両親によってかなり歪められていると思います。