コインフリップコンパレーターを使用するときにランダムな順列を返す「並べ替え」アルゴリズムはありますか?


9

標準の検索アルゴリズムで使用されるコンパレーターが公平なコインフリップで置き換えられたときに実行時間が変更されるかどうかを質問者が知りたいというこの質問と、Microsoftの均一な順列ジェネレーターの書き込み顕著な失敗に触発され、私の質問はこうです:

コンパレータの実装に応じて、比較に基づく並べ替えアルゴリズムはありますか?

  1. 真のコンパレータを使用する場合、要素を並べ替えられた順序で返します(つまり、比較は、標準の並べ替えアルゴリズムで期待されることを行います)
  2. コンパレーターが公正なコインフリップで置き換えられたときに、要素の一様にランダムな順列を返します(つまりx < y = true、xとyの値に関係なく、確率1/2で返します)。

並べ替えアルゴリズムのコードは同じでなければなりません。変更が許可されるのは、比較「ブラックボックス」内のコードのみです。


この質問も参照してください。
ラファエル

2
次の興味深い質問も参照してください:cstheory.stackexchange.com/questions/5321/…
Yuval Filmus 2013年

1
ランダムコンパレータを適切に動作させたいですか?考えられる方法は2つあります。(1)コンパレータが、そして常にx < y、そしてy > xであることを決定すると、(2)同じですが、さらにコンパレータがx < yおよびy < zであると判断した場合、x < z(およびz > x)にコミットします。どちらの場合も、制約のないクエリはそれぞれ完全にランダムです。x<yx<yy>xx<yy<zx<zz>x
Yuval Filmus 2013年

@YuvalFilmus基本的に、リンクされた質問で求められていることを望みます。ただし、ランダムゲートを、要素のペアを順序付ける比較交換ゲートに置き換えると、同じ回路がソートされるはずです。
Joe

1
素敵な視覚化についてはこちらをご覧ください。
ラファエル

回答:


3

次の確定的(コンパレータなし)アルゴリズムは、入力タプルに対して機能します(a1,,an)

  1. コンパレーターを使用して、Fisher-Yatesのシャッフルを静的なペア(たとえば)とコインフリップ(受け入れ拒否のサンプリングを行う)で行います。コンパレータが最初に1を出力する場合は、それを反転して使用して、確定的なケースで無限の拒否ループを回避します。a1<a21
  2. (オプションのスピードアップ:シングルペアを回試行します。nは長さまたは入力です。出力のいずれか2つが異なる場合は、(1)で取得した順列を返します)nn
  3. マージソートを使用して配列をソートします。

決定論的順序関係をコンパレーターとして指定すると、Fisher-YatesシャッフルはOn )で最大Olog n 非ランダム「ランダムビット」(例えば、コンパレーターへの呼び出しを使用して実行されるため、このアルゴリズムは配列を時間でソートします。 )各ステップでマージソートは同じ漸近的な複雑さを持っています。この場合、(1)の結果はまったく役に立ちませんが、その後に実際の種類が続くため、害はありません。O(nlogn)O(n)O(logn)

コンパレータとして実際のコインフリップが与えられた場合(1)は各置換について等しい確率で配列を置換し、本当に(3)を実行する必要がある場合((2)を省略したか(2)ランダム性を決定できなかった)、これはノーです結果の分布は、(1)のためにすべての順列間で均一に分散される入力の順序にのみ依存するため、アルゴリズム全体の結果も均一に分散されるため、害があります。各受け入れ拒否サンプリングを繰り返す必要がある回数は、幾何学的に分布しています(確率< 1で拒否)したがって、期待値は2未満です。各繰り返しの使用高々ログのnビット、ランタイム分析は、決定論場合とほぼ同じですが、我々は唯一の取得ので、予想されるランタイムOをNログN、nontermination(終了のみの可能性はほぼ確実に)。<12<2lognO(nlogn)


Joeが指摘したように:(1)の最初のビットのテストが気に入らない場合は、(3)を実行してから(1)を実行し常に0であるn < a 1を使用します。確定的なケース。さらに、乱数の上限が同じ順列を生成するため、ループの範囲の上限から乱数を減算する必要があります。ただし、身代金の場合は常にシャッフルする必要があるため、(2)は禁止されていることに注意してください。an<a10


(1)と(3)のコンパレータへの同じ呼び出しを使用することもできますが、結果が均一に分散されていることを証明することは、可能であれば、少なくともかなり困難です。


次のアルゴリズムには、シャッフルおよびソートする明確なフェーズはありませんが、漸近的に低速です。基本的には、バイナリ検索を使用した挿入ソートです。私が使用する= 1... nで入力と示すために、B 、K = BのK 1... bはK kは後の結果を示すためにKラウンド番目:a=(a1,,an)bk=(bk,1,,bk,k)k

  1. 設定しb1,1=a1
  2. もし2 < 1、次いでB 2 = 21およびC D = 2 1 他のB 2 = 12及びC D = 1 2 。どちらの場合でもd <a2<a1b2=(a2,a1)(c,d):=(2,1)b2=(a1,a2)(c,d):=(1,2)は、ランダムでないコンパレーターでは常に 0(つまりfalse)になります。ad<ac0
  3. 得るためにためのK 3はB K - 1最初に。bkk3bk1
  4. ましょ及びK ' = 2 、L、すなわちkは'の最小パワーである2より小さくないKl=log2kk=2lk2k
  5. してみましょう。すべてのためにJ { 1 ... L }iはJ = { I 、J - 1 + 2 L - J I J - 1 + 2 L - J > K - 1 D < A 、C 、I 、J - 1 I J 1 + 2 l i0=0j{1,,l}
    ij={ij1+2ljij1+2lj>k1ad<acij1ij1+2lj>k1¬(ad<ac)ij1+2ljij1+2ljk1bk1,ij1+2lj<akij1ij1+2ljk1¬(bk1,ij1+2lj<ak)
  6. il>kbk=(bk1,1,,bk1,il1,ak,bk1,il,,bk1,k1)
  7. bn

k1k

配列を使用すると要素を任意の位置に挿入するとコストがかかり、リストを使用するとバイナリ検索に線形時間が必要になるため、このアルゴリズムは、Fisher-Yatesのシャッフルとマージソートに比べて両方のモードで非効率的です。しかし、おそらく、同様の方法でヒープソートまたはツリーソートを変更すると、アルゴリズムが高速になる可能性があります。


@Joeは、現在の形状の投稿でまだ有効なすべてのポイントを1つのコメントにまとめて、残りを削除できますか?
frafl 2013年

使用するコンパレーターに応じて異なるステップを実行しないアルゴリズムを期待していました。コンパレータをプローブせずに無限の拒否ループを回避できますか?最初にステップ(3)を実行することで、拒否を回避できると思います...
Joe

i

最初のコメント:最初のサンプルビットは捨てないでください。これは「デュアルユース」です。2ビットごとに反転することを考えましたが、それでも無限ループは防げません。実際、いくつかの不規則なパターンが必要であり、さらに多くのエントリを拒否する可能性さえあります。もちろん、最初のビットと最新のビットの代わりに2つの最新のビットをXORすることもできますが、実際には違いはありません。
frafl 2013年

ian<a10

4

n2A/2B1/n!n>21/n!A/2B


1
しかし、これは、質問で要求されていないランタイムの確定的な限界が必要な場合にのみ当てはまります。予想されるランタイムが有限であることのみが必要な場合、これは問題になりません。
frafl 2013年

1
多項式時間で終了しない合理的な並べ替えアルゴリズムを知っていますか?
Yuval Filmus 2013年

2
あなたは決定論的なケースとランダムなケースを混ぜます。アルゴリズムは、確定的な順序関係で呼び出された場合は確定的な多項式時間で終了し、コインをコンパレータとして呼び出した場合は予想される多項式時間で終了します。
frafl 2013年

2k

kA/2k
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.