ボールをビンに投げ、その確率の下限を推定する


14

これは宿題ではありませんが、見た目は似ています。参照は大歓迎です。:-)

シナリオ:あり異なるボールと異なるビン(1〜標識さ左から右には、)。各ボールは独立して均一にビンに投入されます。してみましょう内ボールの数も〜番目のビン。してみましょう次のイベントを示します。n n f i i E in n nf(i)iEi

ごとに、Σ K j個の F K J - 1jikjf(k)j1

すなわち、まず、あるビン(最も左のビンは)より少ないが含まそれぞれに、ボール。J J J Ijjjji

質問:推定、の点で?が無限になったとき。下限が優先されます。簡単に計算できる式は存在しないと思います。 n ni<nPr(Ei)nn

例:Pr(E_n)= 0に注意してください。limnPr(E1)=limn(n1n)n=1ePr(En)=0

私の推測:nが無限になったとき、\ sum_ {i <n} {Pr(E_i)} = \ ln nを推測します。合計の最初の\ ln n項目を検討しました。i<nPr(Ei)=lnnnlnn


1
それは誕生日の問題のサブケースのように見えます。
Gopi

@Gopi私の質問が誕生日の制限の問題であることを自分に納得させることはできません。明示的に説明できますか?どうもありがとうございました。注:制約は、特定のビンのビンの数ではなく、最初のjビンのボールの合計にあります。
eng張

実際、私の悪いことに、誕生日の問題に関するウィキペディアの記事を読み直した後、誕生日の問題から改作された別の問題を検討していることに気付きました。
-Gopi

2
いくつかの間違ったアイデア...状態をエンコードする方法について考えてください:左から右にビンのフォームを読んでください。最初のビンにi個のボールがある場合、i個のボールのシーケンスを出力し、その後に0を続けます。これをすべてのビンに対して左から右に行います。あなたは、このバイナリ文字列(n個のゼロとn個の1つ)に初めてゼロよりも多くの1が含まれるように、最大​​のiに興味があると考えています。ここで、運命を飛ばして、等しい確率で0と1を生成してみましょう。(これは完全なナンセンスかもしれません)。この問題は、カタロニア語の数字とダイクの言葉に関連しています。そして...???1/2
サリエルハーペレ

4
私はあなたの定義では、ボールが異なることが重要である理由を見ていません。また、文字列の統合では、ビンが異なるという事実が考慮されます。
サリエルハーペレ

回答:


11

編集:(2014-08-08)ダグラス・ザアがコメントで指摘しているように、以下の議論、特に2つの確率の間の「橋」は間違っています。私はそれを修正する簡単な方法を見ていません。私はまだ直観を提供すると信じているので、ここに答えを残しますが、は一般的に正しくないことをます。

Pr(Em)l=1mPr(Fl)

これは完全な答えではありませんが、あなたや私よりも知識のある人がそれを終わらせるのに十分なコンテンツが含まれることを願っています。

正確にボールが()最初のビンに入る確率を考慮してください:l nkln

(nk)(ln)k(nln)nk

個未満のボールが最初のビン入る確率を呼び出し。l F lllFl

Pr(Fl)=k=0l1(nk)(ln)k(nln)nk

上記のイベントが発生する確率は、イベントのそれぞれが独立して一度に発生すると考えた場合よりも低くなります。これにより、2つの間の橋渡しができます。F lElFl

PrEml=1mPrFl=l=1mk=1l1nklnknlnnk=l=1mFl1;nln

ここでである二項分布の累積分布関数と。ウィキペディアのページを数行下に読んで、に注目すると、Chernoffの不等式を使用して以下を取得できます。p=lFl1;nlnL-1p個のNp=lnl1pn

PrEml=1mexp[12l]=exp[12l=1m1l]=exp[12Hm]exp[1212m+lnm+γ]

ここで、は番目の調和数、はオイラー・マスケローニ定数であり、の不等式はWolframのMathWorldリンクページから取得されます。 M γ H MHmmγHm

ファクターを心配することなく、最終的に次のことがわかります。e1/4m

Pr(Em)eγ/2m

以下は、参照用にプロットされた関数とともに、関数として平均100,000インスタンスのログ-ログプロットです。、M個のE - γ / 2n=2048meγ/2m

ここに画像の説明を入力してください

定数がオフの間、関数の形式は正しいように見えます。

以下は、各ポイントが関数として100,000インスタンスの平均であるを変化させた対数プロットです。mnm

ここに画像の説明を入力してください

最後に、ことがわかっているため、回答したい元の質問に到達します。PrEm1m

<nPrEn

また、数値検証として、以下は、合計とインスタンスサイズ対数プロットです。各ポイントは、100,000インスタンスの合計の平均を表します。関数は参照用にプロットされています。nはX 1 / 2Snバツ1/2

ここに画像の説明を入力してください

両者の間に直接的なつながりはないようですが、この問題のトリックと最終的な形式は、コメントで最初に推測された誕生日問題と多くの共通点を持っています。


4
を取得するにはどうすればよいですか?たとえば、場合、と計算し最初のビンが空であると言われた場合、これは最初の2つのビンが最大でボールを保持する可能性が多少なりますか?より可能性が高いため、は過小評価されています。のn = 100 のP R E 2= 0.267946 > 0.14761 = P R F 1のP R F 21 P r F 1P r F 2Pr(E2)Pr(F1)×Pr(F2)n=100Pr(E2)=0.267946>0.14761=Pr(F1)Pr(F2).1Pr(F1)Pr(F2)
ダグラスザーレ14

@DouglasZare、私はあなたの計算を検証しました、あなたは正しいです。より厳格ではないという理由で、私に正しいサービスを提供しています。
user834 14

15

答えはです。Θ(n)

まず、計算しましょう。En1

ボールをビンに投入し、ビンに正確にボールがある確率を見てみましょう。この確率はポアソン分布に由来し、がになると、指定されたビンに正確にボールがある確率はです。nnknk1e1k!

次に、ボールをビンに分配する別の方法を見てみましょう。ポアソン分布から選択された各ビンにいくつかのボールを投入し、合計ボールがあることを条件とします。これは、ボールをビンに投入するのとまったく同じ分布になると主張しています。どうして?番目のビンに個のボールがある確率は、両方の分布でに比例することがわかります。nnnkjjj=1n1kj!

そこで、各ステップで、確率から移動するランダムウォークを考えてみましょう。このランダムウォークがステップ後に0に戻るというイベントを条件にすると、このランダムが常に超える確率は、OPが計算したい確率であると主張します。どうして?このランダムウォーク後のこの高さステップはある最初のボールの数を引いビン。tt+1k1e1k!n0sss

の確率で各ステップでを上下するランダムウォークを選択した場合、これは古典的な投票問題となり、その答えは。これは調査済みの投票問題の変形であり(このペーパーを参照)、答えはまだです。この場合のの定数を簡単に計算する方法があるかどうかはわかりません。12112(n1)Θ(1n)Θ(1n)

同じ論文は、ランダムウォークが高さで終了するように条件付けられている場合、限り、常に正にとどまる確率がています。この事実により、を推定ます。Θ K / N K = O kΘ(k/n)Essk=O(n)Ess

残りの回答では少し手を振るつもりですが、これを厳密にするために標準的な確率手法を使用できます。

が、このランダムウォークはブラウンブリッジ、つまり開始および終了するように条件付けられたブラウン運動に収束することがわかり。一般的な確率定理から、場合、ランダムウォークは軸からおおよそ離れています。高さが場合、前全時間にわたってを超えている確率はです。以来、そうすべきである、我々は0 ε N < S < 1 - ε Nn0ϵn<s<(1ϵ)nXT>00SΘT/STΘΘ(n)xt>00sΘ(t/s)ts=ΘnΘ(n)s=Θ(n)EsΘ(1/n)


4

[編集2014-08-13:Peter Shorのコメントのおかげで、このシリーズの漸近的成長率の推定値を変更しました。]

私の考えでは、はとして成長します。証拠はありませんが、説得力のある議論があると思います。リムn<nPrEn

レッツビンの中のボールの数を与えるランダム変数である。ましょうビン内のボールの総数与えるランダム変数である介して以下です。i B i j = j k = i B k i jBi=f(i)iBi,j=k=ijBkij

書くことができます。任意のための。そのために、関数と紹介しましょう。J < I π G IPr(Ei)=b<jPr(EjB1,j=b)Pr(EiEjB1,j=b)j<iπgi

π(j,k,b)=Pr(Bj=kB1,j1=b)=(nbk)(1nj+1)k(njnj+1)nbk

gjkb=PrEBjkEj1B1j1=b={0k<01k> =0j>l=0jb1πjlbgj+1klb+lotherwse

に関して書くことができます:g iPrEg

Pr(Ei)=gi(1,i1,0)

今は、の定義から明らかだことgi

PrE=nn+1nnhn

ここで、は次数の多項式です。これは直感的な意味もあります。少なくとも個のボールを番目から番目までのビンのいずれかに入れる必要があります(その中にはがあります)。n i 1 n i + 1 i + 1 n n ihnn1n+1+1nn

場合、についてのみ話しているため、リード係数のみが関連します。この係数をと呼びましょう。それからのn H IN IPrEnhna

リムnPrE=ae

計算方法は?さて、ここで少し手を振るところです。最初のいくつかの計算すると、この係数の計算でパターンが現れることがわかります。あなたはそれを次のように書くことができますE iaE

μ IJ K B = { 0 、K < 0 1 K > = 0 I > J Σ J - B - 1 L = 0 1

a=μ110
where
μjkb={0k<01k> =0>jl=0jb11lμj+1klb+lotherwse

今では、閉じた形式の同等物を直接導出することはできませんでしたが、最初の20個の値を計算しました。PrE

N       a_i/e^i
1       0.367879
2       0.270671
3       0.224042
4       0.195367
5       0.175467
6       0.160623
7       0.149003
8       0.139587
9       0.131756
10      0.12511
11      0.119378
12      0.114368
13      0.10994
14      0.105989
15      0.102436
16      0.0992175
17      0.0962846
18      0.0935973
19      0.0911231
20      0.0888353

さて、

PrE=e=ポア;

ここで、は、平均ポアソン分布から抽出されたときに、確率変数が値持つ確率です。したがって、合計を次のように書くことができます。X I λポア;λバツλ

リムn=1nPrE=バツ=1バツバツバツeバツ

Wolfram Alphaは、このシリーズが分岐することを教えてくれます。Peter Shorは、スターリングの近似によりを推定できるというコメントを指摘しています。PrE

リムnPrEバツ=バツバツバツeバツ12πバツ

させる

ϕバツ=12πバツ

以来

  • リムバツϕバツϕバツ+1=1
  • ϕバツは減少しています
  • 1nϕバツdバツ asn

私たちのシリーズはとして成長します(例えば、定理2を参照)。あれは、1nϕバツdバツ

=1nPrE=Θn

1
Wolfram Alphaは間違っています。スターリングの式を使用します。それは、と言います。バツバツ/バツeバツ1/2πバツ
ピーターショー

@PeterShorありがとう!私はあなたの洞察力のおかげで結論を更新しました、そして今、私は他の2つの答えに同意しています。この問題に対する3つのまったく異なるアプローチを見るのは興味深いことです。
ruds

4

(すべてのn ^ nケースを調べることにより)最初のいくつかの用語を徹底的にチェックし、少しのルックアップにより、答えがhttps://oeis.org/A036276 /ことが示されます。これは、答えがことを意味します。nは1nnn12π2

より正確には、答えは であり、閉じた形式はありません回答。

n2nnk=0n2nkk

Oeisはすごいです
トーマス・Ahle
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.