確率過程のような雪崩


16

次のプロセスを検討してください。

あるnビンは上から下に配置されています。最初は、各ビンに1つのボールが含まれています。すべてのステップで、私たちは

  1. ランダムに均一にボール を選び、b
  2. bを含むビンからその下のビンにすべてのボールを移動します。既に最下位のビンであった場合、プロセスからボールを​​削除します。

プロセスが終了するまで、つまり、nボールがすべてプロセスから削除されるまで、どのくらいのステップが予想されますか?これは以前に研究されたことがありますか?答えは既知の手法から簡単にわかりますか?

最良の場合、プロセスはnステップ後に終了できます。最悪の場合、Θn2ステップかかることがあります。ただし、どちらの場合も非常にまれです。私の推測では、Θnログnステップかかり、これを確認するようにいくつかの実験を行いました。

(ランダムにビンを均一に選択することは非常に異なるプロセスであり、明らかにΘn2ステップを完了することに注意してください。)


質問はおもしろそうです(答えはわかりませんが)。非単調性のために難しいようです。すべてのn個のボールが一番上のビンにある場合、プロセスは明らかにn個のステップで終了します。
伊藤剛

回答:


11

本当の答えではなく、アンドラスの答えに対する拡張コメント。

Andrásの答えには良い直観が含まれていますが、予想されるステップ数の厳密な計算ではないと思います。これはおそらく答えの良い近似だと思いますが、最上位のビンが下に空になる前に、最も高い占有ビンの下のビンが空になる場合を適切に処理するようには見えません。それでも、これは合理的な近似値になる可能性があります(わかりません)。

彼の計算には、スケーリングに影響するエラーが含まれています。まったく同じ開始点を取り、計算をやり直して拡張します。

ランダムに正しいビンを選択する確率があるように、それは、合計内部のpの係数をミス1ではなく npn。結果として、1n

n+p=1nk=0k+1pnnpnk=n+p=1npnk=0k+1npnk=n+p=1npnn2p2=n+np=1n1/p=n1+Hn

ここで、はn番目の調和数です。近似するHをN我々は単に不可欠で和を置き換えることができます:H Nのn + 1 1 1Hn=p=1n1/pHn。したがって、スケーリングはn1+logn+1または約nlogn+1です。このスケーリングは問題のスケーリングと正確には一致しませんが(以下のシミュレーションを参照)、ほぼ正確にlogHn1n+11バツdバツ=ログn+1n1+ログn+1nログn+1ログ2

シミュレーションと理論

赤い丸:1万回の実行で平均化されたプロセスのシミュレーションのデータポイント。緑:。青:n log n + 1 nログ2n+1nログn+1


@ジョー:いいですね!因子がギャップの作成からどのように生じるかを厳密に示すことは興味深いでしょう。ln2
アンドラスサラモン

@András:これが適切な近似であるかどうかについて、私は本当に良い気持ちを持っていません。シフトダウンするバンチの形成に関する@Peterの考えは、これらがどのビンでも等しく形成される可能性があると仮定して、正しい表現を与える必要があるようです。
ジョーフィッツシモンズ

@ジョー:ケースのほぼ3分の1で、一番上のボールが孤立したままになります。トップ3のボールを考えてください。中央の1つが最初に選択された場合(3つのうち)、3つ目に参加します。これら2つは、それ以降、トップボールの2倍の速さで動きます。それらとトップボールとの間の距離は、非常に偏ったランダムウォークであり、トップボールが追いつく確率は、小さな(ish)定数(概算15%)によって制限されます。しかし、良いニュースは、ログの上位n個のボールは実際には重要ではないということです。他のすべてがn \ log nステップでクリアされる場合、追加のn \ log nステップのみが追加されます。
マティアス

ここに2つのプロットがあります。両方とも、log nボールを除くすべてがクリアされるまで、ステップ数をで除算した値を表示します。最初の方法では、システムからドロップしたボールを選ぶことができます(アンドラスが提案したように)tinyurl.com/2wg7a9y。2番目の場合、システムからドロップするボールはもう選択されません:tinyurl.com/33b63pq。ご覧のとおり、最初のプロセスが与えることのできる範囲はおそらく弱すぎます。たぶん、システム内のボールの数を常に半分にするフェーズ(ピーターがどこかで書いたように)を考慮することで調整できるでしょうか?nログn
マティアス

@Matthias:Peterの直感が正しいと仮定して予想時間を分析することは、(少なくとも私の観点からは)障害ではありません。この直観が実際に最初に必要なことの公正な反映であることを証明する私にとって、それは良い近似であると疑いますが。
ジョーフィッツシモンズ

9

編集:定理を証明する厄介なプロセスを説明するために、(今のところ)この答えをそのままにしておきます。これは、公開された論文には残されていません。ここでの核となる直感は、一番下のボールが一掃されるので、一番上のボールに集中するだけで十分であるということです。コメント(特にギャップが発生する可能性があることを指摘している@Michael)と、エラーの特定および修正方法についての@Joeの後の回答を参照してください。特に、Joeが実験を使用して、式が適切かどうかを再確認するのが好きです。


n1+π2/6n

b1b2bnb1=nb2n1bn+1b1b2bn12n)。これらは、個別のイベントとして次々に表示されます。予想されるステップ数は

n+p=1nk=0k+1n(npn)k=n+p=1n11npk=1k(npn)k=n+p=1n11npn(np)/p2=n+np=1n11/p2(1+π2/6)n.


3
@Andras @Joe: Holy schmoley. If all the people asking the questions on this site took their questions as seriously as you take answering them, this would be the badassest url on the internet.
Aaron Sterling

1
@András: I'm trying to understand your statement "a sequence of balls will clear all the bins precisely if it contains a subsequence...". Maybe I've misunderstood something, but say we have four balls. If the sequence is 3,4,3,2,4 then it seems to satisfy your subsequence requirement, yet not all the bins have been cleared.
Michael

1
@András: If you want to show a reasonable upper bound, you have to use the fact that balls disappear from the process and are no longer picked. Otherwise, the top most ball is always only picked with probability 1/n and there is a good chance (maybe slightly less than 1/2) that this ball will stay isolated the whole time. For this ball, you will need n^2 steps.
Matthias

1
@Michael: I think you have identified the mistake. I'm assuming falsely that the top ball will move down even if there is a gap.
András Salamon

2
Here's my intuition. After a few steps, some clump of balls is going to be larger than any other clump of balls. At this point, the clump moves faster than everything else, clears everything below it and falls out of the system. This whole process should take O(n) or maybe O(nlogn)ステップ。この最初の塊はラインに均一に分布しているため、平均してボールの半分が必要です。今、私たちは周りのシステムが残っていますn/2ボール、および別の塊が形成されます。だから周りにlogn塊、私たちは完了です。
ピーターショー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.