複数の衝突による逆誕生日問題


9

長さNが不明なエイリアン年があったと仮定します。異星人のランダムなサンプルがあり、それらのいくつかが誕生日を共有している場合、このデータを使用して年の長さを推定できますか?

たとえば、100のサンプルでは、​​2つのトリプレット(つまり、3人のエイリアンが共有する2つの誕生日)と5つのペアと84個のシングルトンを持つことができます。Nの推定では、絶対最小値は91で、最大値は無制限ですが、妥当な期待値はどのようにして見つけますか?

仮定には、「すべての誕生日が同じくらい可能性が高い」などが含まれます。

ここで回答された別の質問とは異なり、部屋には既知の衝突があります。十分に長い年であれば、宇宙人の部屋で衝突がない可能性が非常に高くなります。ただし、非常に長い年は衝突の確率が低く、短い年はほとんど衝突の確率が低いため、最も可能性の高い年の長さに対して(理論的な)範囲が提供されます。


3
この質問の特別なバージョンに対する私の回答は(多項分布を使用して)簡単に一般化されます。stats.stackexchange.com/questions/252813を参照してください。
whuber

@Techheadさまざまな方法で!言及するパラメータ推定の明白なアプローチは、最尤です。
Glen_b-モニカを2017


1
@whuberその質問とあなたのコメントを見ましたが、既知の衝突があるサンプルにそのほとんどを適用する方法がわかりませんでした。展開された形式を見つけるのは難しくありませんが、対数の合計をどのように見つけるかわかりません。
Techhead 2017年

1
あなたのバージョンは非常に複雑で、複製として閉じないでください。
whuber

回答:


2

分布の期待値は、として計算されます。この問題については、我々はの分布を計算したいNいくつかの衝突基準与えられたのか、見つけるEをN = Σ のn = 0、P nは nはいくつかの衝突判定基準、与えられたp N = P N = nでE(X)=pixiNE(N)=n=0pnnpn=P(N=n).

qnn.qnqnnqnpn.

pnqnpn=αqn.n=0pn=1αn=0qn=1α=1n=0qn.qn

N=n.nn1n(n1)(n2)...(n83)n(n1)(n2)...(n8452+1)

91(911)(912)...(917+1)76

rn=n(n1)...(n8452+1)(84+5+2)(84+5+21)...(84+1)(5+2)(5+1)

abca,b,cnmqn=rnnm

rnyn=n(n1)...(n(a+b+c)+1)=n!(n(a+b+c))!znrnrn=ynznznzn=zpn=qn/i=0qiqn=zynnmzpn=ynnm/i=0(yiim)yns=a+b+c

pn=n!(ns)!nm/i=0(i!(is)!im)

pnE(N)P(N=n)qnN=nP(N=n)E(N)pnn


確率質量関数ではなく、尤度関数に基づいて期待値を計算することを提案しているようです。それは意図的なものでしたか?
Sextus Empiricus

2

NN

この回答では、より簡潔に書き留め、この尤度関数の最大値を計算する方法を提供したいと思います(計算するのがはるかに難しい期待値ではありません)。


Nの尤度関数

a+2b+3cnabc

rn=(na+b+c)number of ways topick m unique birthdaysout of n days(a+b+c)!a!b!c!number of ways todistribute m birthdaysamong groups of size ab and c(a+2b+3c)!1!a2!b3!cnumber of ordered ways toarrange specific single, duplicate, and triplicatesamong the aliens =n!(nabc)!×(a+2b+3c)a!b!c!1!a2!b3!c

そして、右側の最初の項のみがに依存するため、他の項を除外することにより、尤度関数n

L(n|a,b,c)=n(a+2b+3c)n!(nabc)!=nmn!(ns)!P(a,b,c|n)

ここで、Codyの表記法に従い、を使用してエイリアンの数を示し、を使用してユニークな誕生日数を示します。ms


Nの最尤推定

この尤度関数を使用して、最尤推定値を導出できます。N

ご了承ください

L(n)=L(n1)(n1n)mnns

最大値は直前に発生しますのためにn

(n1n)mnns=1

または

s=n(1(11/n)m)

これは大きいためである(置換することによって見つけることができるローラン級数を用いて約とするためのテイラー級数書き込み点で)nx=1/nxx=0

sk=0l(mk)(n)k+O(n(l+1))

1次の項のみを使用すると、次のようになります。smm(m1)2n

n1(m2)ms

2次項も使用すると、が得られます:smm(m1)2n+m(m1)(m2)6n2

n2(m2)+(m2)24(ms)(m3)2(ms)

したがって、一意の誕生日が含まれるエイリアンの場合、近似およびを使用して取得します。方程式を数値で解くと、が得られます。これをに切り捨てて、MLEを求めます。m=100s=91n1550n2515.1215n=516.82n=516

近似を真のMLEと比較する

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.