クーポンコレクター時間の厳密な下限とは何ですか?


20

古典的なクーポンコレクターの問題では、ランダムに選択されたクーポンのセットを完了するのに必要な時間が、および満たすことがよく知られています。。TnE[T]nlnnVar(T)n2Pr(T>nlnn+cn)<ec

この上限は、おおよそ1 / c ^ 2になるチェビシェフ不等式によって与えられる上限よりも優れてい 1/c2ます。

私の質問は次のとおりです。よりも良い-チェビシェフが対応している下限のためのT?(たとえば、Pr(T<nlnncn)<ec)?


明白な下限があるPr(T<n)=0 ...が、私はそれをあなたがしている認識して推測する
ワンストップ

回答:


14

分析は完全に初歩的であり、正確に目的の結果を提供するため、これを2番目の回答として提供します。

命題についてはおよび、 c>0n1

P(T<nlogncn)<ec.

証明の背後にある考え方は簡単です:

  1. すべてのクーポンが収集されるまでの時間をとして。ここで、は番目(以前)の一意のクーポンが収集される時間です。、平均時間を有する幾何ランダム変数である。T=i=1nTiTiiTinni+1
  2. チェルノフ限界のバージョンを適用し、単純化します。

証明

任意のおよび任意場合、 S > 0 PT < T = PE - S T > E - S TE S T E E - S Tt s>0

P(T<t)=P(esT>est)estEesT.

以来、と独立している、我々は書くことができ T i E e s T = n i = 1 E e s T iT=iTiTi

EesT=i=1nEesTi

以来、今、幾何学的である、のは、成功の確率で言わせて、その後、簡単な計算ショー p i E e s T i = p iTipi

EesTi=pies1+pi.

この問題のは、、などです。したがって、 p 1 = 1 p 2 = 1 1 / n p 3 = 1 2 / n n i = 1 E e s T i = n i = 1 i / npip1=1p2=11/np3=12/n

i=1nEesTi=i=1ni/nes1+i/n.

いくつかのに対しておよびを選択し ましょう。次に、 およびで、 t = n logs=1/n、C > 0 、E S Tは = N E - C E S = E 1 / N1 + 1 / N N Π iが= 1のI / Nをt=nlogncnc>0

est=nec
es=e1/n1+1/n
i=1ni/nes1+i/ni=1nii+1=1n+1.

これをまとめると、

P(T<nlogncn)nn+1ec<ec

望んだ通りに。


それはとてもいいことで、医者が注文したものです。ありがとうございました。
デビッド

好奇心が強い@David:意図したアプリケーションは何ですか?
枢機

長い話。私は、興味のあるアルゴリズムの実行時間を分析するために調理したマルコフ連鎖の混合時間の下限を証明しようとしています-これは、c .collectorの問題。ところで、私はまさにこの種のチェルノフスタイルの限界を見つけようとしていましたが、でその製品を取り除く方法を理解していませんでした。選択する良いコール:-)。s = 1 / nis=1/n
デビッド

@David、はほぼ確実に準最適ですが、を与えたため、試してみるのは明らかなことのようでした。上限。s=1/nest=nec
枢機

1
リクエスト:上記の証明は私自身のものです。問題が私を興味をそそったので、私は楽しみからそれで働きました。しかし、私は目新しさを主張しません。実際、同様の手法を使用した同様の証明がまだ文献に存在していないとは想像できません。誰かが参照を知っているなら、ここにコメントとして投稿してください。私は次のようになり非常に 1を知って興味を持って。
枢機

9

@cardinalは、私が探していた境界を正確に与える答えをすでに与えていますが、より強い境界を与えることができる同様のChernoffスタイルの引数を見つけました。

命題: (これはより強力です)C > π 2

Pr(Tnlogncn)exp(3c2π2).
c>π23

証明

の答えのように、は成功確率の独立した幾何学的ランダム変数合計であるという事実を使用できます。その次及び。T i p i = 1 i / n ETTipi=1i/n E [ T ] = n i = 1 E [ T i ] = n n i = 1 1E[Ti]=1/piE[T]=i=1nE[Ti]=ni=1n1inlogn

新しい変数、およびます。その後、 S = Si:=TiE[Ti]のPr T N ログN - C N のPr T E [ T ] - のC 、N = PrのSを- Cをn = Pr exp s SS:=iSi

Pr(Tnlogncn)Pr(TE[T]cn)=Pr(Scn)
=Pr(exp(sS)exp(scn))escnE[esS]

平均を計算すると、

ES-1SEのZ

E[esS]=iE[esSi]=ies/pi1+1pi(es1)e12s2ipi2
ここで、不等式はおよびのための。es1sZ0ez1+ze12z2z0

したがって、、書くことができます のPrTNログN-CN E 1ipi2=n2i=1n11i2n2π2/6

Pr(Tnlogncn)e112(nπs)2scn.

で最小化すると、最終的に のPr T N ログN - C N E - 3 、C 2s>0

Pr(Tnlogncn)e3c2π2

1
(+1)いくつかの小さなタイプミスを法として、これは素晴らしいことです。あなたがやったように、平均に近いものを中心に拡大することは、しばしばよりうまくいきます。漸近的な結果に照らして、高次の収束を見て驚くことではありません。ここで、同様の上限を示すと、はVershyninの用語で準指数関数的であることが証明されます。これは、測定濃度に関して多くの意味を持ちます。(Tnlogn)/n
枢機

1
引数は上限に直接一般化しないようです。を(およびを)と交換すると、。ただし、この時点でできることは、、それはまだと私はしませんこれをどうするかわからない- C S - S E [ E S S ] Π I E - S / PのIccssE[esS]ies/pi1spiez1zexp(z22(1z))
E[esS]e12s2ipi2(1s/pi)
デビッド

2
ただし、興味深いことに、(下限の)引数全体は、クーポンコレクターの問題だけでなく、有界分散のある同一ではない独立した幾何学的変数の合計で機能するようです。具体的に:与えられた場合、各は成功確率独立GVであり、ここで、その後 T i p i i pT=iTiTipiipi2A<
Pr(TE[T]a)ea22A
デビッド

4

重要な注意:この回答で元々提供した証拠を削除することにしました。それはより長く、より計算的で、より大きなハンマーを使用し、私が与えた他の証拠と比較してより弱い結果を証明しました。あらゆる点で、劣ったアプローチ(私の意見では)。あなたが本当に興味があるなら、私はあなたが編集を見ることができると思います。

私が最初に引用した漸近的な結果は、この回答でまだ見つかっていますが、として、すべての当てはまる他の回答で証明された限界よりも少し良くできることを示しています。n n


次の漸近的な結果が成り立ちます

P(T>nlogn+cn)1eec

そして

P(Tnlogncn)eec.

定数および制限はとして取得されます。2つの結果に分かれていますが、どちらの場合もが非負に制約されないため、結果はほとんど同じであることに注意してください。 N CcRnc

例えば、Motwani and Raghavan、Randomized Algorithms、pp。60--63を参照してください。


また、 Davidは、この回答へのコメントで述べられている上限の証拠を親切に提供します。


n

1
Aiinlogn+cn1 - N - 1 I Σ IP(τ>nlogn+cn)=P(iAi)iP(Ai)1n1ii(11/n)nlogn+cnnexp(nlogn+cnn)=ec

@David、それは素晴らしく簡単です。私はすぐに別の用語で包含/除外式を拡張してみましたが、すぐにどこにも到達せず、さらに詳しく調べる時間もありませんでした。イベントは、後にクーポンが残らないイベントと同等です{T<tn}tn

@David、上記の証明にはサインの反転がありますが、他の読者にも明らかであると確信しています。
枢機卿

@David、あなたの質問に対する他の投稿された答えを見てください。この方法は、指定した上限とは異なりますが、ここで示した答えとは対照的に、使用するツールはほとんど基本的です。
枢機

2

Benjamin Doerr 、本「ランダム化検索ヒューリスティックの理論」の「ランダム化検索ヒューリスティックの分析:確率理論からのツール」の章で、オンラインPDFのリンクを参照してください。

TPr[T(1ϵ)(n1)lnn]enϵ

nϵ

これが証明スケッチです。

XiitPr[Xi=1]=(11/n)tXiI[n]Pr[バツ=1]Pr[バツ=1]tjt

Pr[バツ=1|バツj=1]Pr[バツ=1]jPr[バツ=1|バツj=0]Pr[バツ=1]jk||kn1||knj

Pr[T1ϵn1lnn]111/ntnt=1ϵn1lnn

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.