本当の答えではなく、アンドラスの答えに対する拡張コメント。
Andrásの答えには良い直観が含まれていますが、予想されるステップ数の厳密な計算ではないと思います。これはおそらく答えの良い近似だと思いますが、最上位のビンが下に空になる前に、最も高い占有ビンの下のビンが空になる場合を適切に処理するようには見えません。それでも、これは合理的な近似値になる可能性があります(わかりません)。
彼の計算には、スケーリングに影響するエラーが含まれています。まったく同じ開始点を取り、計算をやり直して拡張します。
ランダムに正しいビンを選択する確率があるように、それは、合計内部のpの係数をミス1ではなく npn。結果として、1n
n + ∑p = 1n∑k = 0∞(k + 1 )pn(n − pn)k====n + ∑p = 1npn∑k = 0∞(k + 1 )(n − pn)kn + ∑p = 1npn⋅ n個2p2n + n ∑p = 1n1 / pn (1 + Hn)
ここで、はn番目の調和数です。近似するHをN我々は単に不可欠で和を置き換えることができます:H N ≈ ∫ のn + 1 1 1Hn= ∑np = 11 / pHn。したがって、スケーリングはn(1+log(n+1))または約nlog(n+1)です。このスケーリングは問題のスケーリングと正確には一致しませんが(以下のシミュレーションを参照)、ほぼ正確にlog倍(Hn≈ ∫n + 111バツdx = ログ(n + 1 )n (1 + ログ(n + 1 ))n ログ(n + 1 )。ログ(2 )
赤い丸:1万回の実行で平均化されたプロセスのシミュレーションのデータポイント。緑:。青:n log (n + 1 )n ログ2(n + 1 )n ログ(n + 1 )。