ランダム分割による選択のための鋭い集中?


11

アレイ内のメジアン要素を発見するための通常の単純なアルゴリズムの数です。nAn

  • から要素を置き換えてサンプルする A Bn3/4AB
  • ソートとランクを見つける要素との| B | ± B lrB|B|±nlrB
  • そのチェックと中央値の反対側にあるとせいぜいがあることの要素との間のといくつかの適切な定数を。これが起こらない場合は失敗します。R A C lrA AlrC>0CnAlrC>0
  • それ以外の場合は、の要素をと間で並べ替えて中央値を求めます。L個のRAlr

これが線形時間で実行され、高い確率で成功することを確認するのは難しくありません。(すべての悪いイベントは、二項式の期待から大きく逸脱しています。)

クイックソートを見た生徒に教えるのがより自然な同じ問題の代替アルゴリズムは、ここで説明するものです。ランダム化された選択

これが線形の予想実行時間を持っていることも簡単にわかります。「ラウンド」は、1/4から3/4の分割が行われたときに終了する再帰呼び出しのシーケンスであり、予想される長さがラウンドの最大数は2です(ラウンドの最初のドローでは、アルゴリズムが説明されているように、ラウンドの長さが幾何ランダム変数によって支配されるため、ラウンドが適切に分割される確率は1/2になり、その後実際に増加します。)

だから今の質問:

ランダム化された選択が高い確率で線形時間で実行されることを示すことは可能ですか?

我々はラウンドを、各ラウンドは少なくとも長有する確率で最大で結合した組合が実行時間であることを与えるので、確率。k 2 k + 1 O n log log n 1 1 / O log n O(logn)k2k+1O(nloglogn)11/O(logn)

これはちょっと物足りないですが、本当ですか?


質問が参照するアルゴリズムを明確にしてください。
ラファエル

ユニオンの境界を正しく適用したか、それともより良い、より満足のいく境界があるかどうかを尋ねていますか?
ジョー

@ジョー後者。ポイントは、ラウンドは、ラウンドの長さがジオメトリによって支配されるようにするためのアーティファクトであるということです。次に、anaylisysは、アルゴリズムが常にノーズで1 / 4-3 / 4分割されるアルゴリズムの前か後ろかを「忘れて」、幾何学を独立させます。ユヴァルが下に置いたこの「浮気」がまだきついかどうか私は尋ねている。
Louis

回答:


5

Θ(n)G(1/2)p(n)0Ω N ログ2 P nは- 1= ω N Pr[G(1/2)log2p(n)1]=p(n)Ω(nlog2p(n)1)=ω(n)

(最初のラウンドの長さは実際にははないため、不正行為が含まれています。より慎重に分析すると、この答えが検証される場合とされない場合があります。)G(1/2)

編集:GrübelとRoslerは、予想される比較数を割った値が(ある意味で)制限のない分布になりがちであることを証明しました。たとえば、元の論文を参照するグルーベルの論文「Hoareの選択アルゴリズム:マルコフ連鎖アプローチ」を参照してください。n


ここで私が気になることがある。上記のコメントで述べたように、ラウンドは、処理を進めるのに十分なピボットを取得するまで待機するアルゴリズムの「スローダウン」バージョンを分析するための単なる方法です。表示されているのは、の固定の場合、超えるピボットを必要とする最初のラウンドの確率がです。ただし、原則として、長い最初のラウンドは、2番目のラウンドが空になることで相殺される可能性があります。つまり、「非スロー」アルゴリズムが最後に常に1 / 4-3 / 4の分割を行うアルゴリズムに追いついたという意味です。 。C > 0C>0C>0
Louis

1
それは真実ではありません。最初のラウンドが長いと、全体の実行時間が長くなります。それ以降のラウンドでは実行時間を短縮できないためです。重要なのは、どのでも、最初のラウンドには一定の確率で少なくとも時間がかかるということです。C n p C > 0CCnpC>0
Yuval Filmus

丸い長さは、上限に使用されている幾何学的形状よりもずっと小さくないので、今は幸せです。これがG&Rが厳しくしていることだと思います。いい答え。
Louis
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.