中央値選択のストレージ要件(2パスアルゴリズム)


18

古典的な論文で、マンロとパターソンは、アルゴリズムがランダムにソートされた配列の中央値を見つけるために必要なストレージの量の問題を研究しています。特に、次のモデルに焦点を当てています。

入力は、左から右へ数P回読み取られます。

それが示されているメモリセルで十分ですが、対応する下限はP = 1についてのみ知られています。P> 1の結果は見ていません。誰もそのような下限を知っていますか? O(n12P)

ここでの主な難点は、2回目のパスで入力がランダムに順序付けされなくなることです。

回答:


14

:最近SODAにチャンでこの論文を試してみてくださいhttp://portal.acm.org/citation.cfm?id=1721842&dl=ACM

迅速なGoogleの検索もそのルックスおそらく関連する以下の論文を見つけましたが、私はそれを読んでいない:http://portal.acm.org/citation.cfm?id=1374470を


ありがとう、2番目の論文は私の質問に部分的に答えているようです。このような答えは、私が知っていた以前の論文にはありません。
MassimoLauria

18

1パス以上の境界を証明する最初の論文は、SODA'08のJayramとAmitの論文でした。次に、ウォーレンが言及した論文があります。これは、より明確な証明によって境界を改善します。

つまり、パス数の前に定数を許可する場合の依存関係を理解し​​ています。もちろん、これらの定数は指数内にあるため、正確な理解を求めることができます。私の主な不満は、マルチパスストリーミングのモデルのモチベーションがそれほど高くないことです。

より興味深い質問は、分岐プログラムの下限を証明できるかどうかです。必要に応じてメモリにアクセスできる境界空間アルゴリズムであっても、マルチパスストリーミングを実行することが最善の戦略であると言えますか?

答えは肯定的であるように思われ、それを証明するための部分的な進歩があります。


5
マルチパスストリーミング、次の種類の実験では自然なモデルだと思います。ランダム化サンプリングを使用して、統計テスト(置換テストなど)を行います。何十億もの実験を実行します。各実験はPRNGから乱数を取得し、いくつかの出力値を生成します。次に、これらの値の中央値、ヒストグラムなどを計算します。出力ストリームへの効率的なランダムアクセスがなく、すべてを保存するためのメモリがありません。ただし、ストリームを再生できます。同じシードを使用してPRNGをリセットし、アルゴリズムを再実行するだけです。
ユッカスオメラ

2
最適なのは、マルチパスストリーミングモデルに上限を設定し、分岐プログラムの関連するファミリの下限を一致させることです。
MassimoLauria
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.