


  • 入力: nk、vector (x1,x2,,xn)

  • 出力: vector (y1,y2,,ynk+1)、ここでyiの中央値です(xi,xi+1,,xi+k1)







たとえば、これらの線に沿って何かを行うことができます。入力ベクトルをサイズ部分に分割します。各部分をソートします(各要素の元の位置を追跡します)。そして、区分的にソートされたベクトルを使用して、補助データ構造なしで実行中の中央値を効率的に見つけますか?もちろん、これはまだO n log kkですが、実際には、配列のソートは検索ツリーを維持するよりもはるかに高速になる傾向があります。O(nlogk)

編集2: Saeedは、検索ツリー操作よりもソートの方が速いと思う理由をいくつか見たいと思っていました。以下は、n = 10 8の非常に簡単なベンチマークです。k=107n=108

  • ≈8s:それぞれk個の要素を持つベクトルをソートn/kk
  • ≈10s:要素を持つベクトルの並べ替えn
  • ≈80s:サイズkのハッシュテーブルでの挿入と削除nk
  • ≈390s:サイズkのバランスの取れた検索ツリーでの挿入と削除nk



(技術的詳細:データ=ランダムな32ビット整数。コンピューター=典型的な最新のラップトップ。テストコードはC ++で記述され、標準ライブラリルーチン(std :: sort)とデータ構造(std :: multiset、std ::を使用) unsorted_multiset)。2つの異なるC ++コンパイラ(GCCおよびClang)、および標準ライブラリの2つの異なる実装(libstdc ++およびlibc ++)を使用しました。伝統的に、std :: multisetは高度に最適化された赤黒木として実装されています。)

を改善できるとは思わない。あなたは、ウィンドウを見ればその理由は、あるのx トンx t + k 1x t + kの数字を除外することはできませんnlogkxt,...,xt+k1は将来のウィンドウの中央値であることから。これは、少なくともkを保持する必要があることを意味しますxt+k2,...,xt+k1データ構造内の 2つの整数。ログ時間よりも短い時間で更新されないようです。k2
私にはあなたの些細なアルゴリズムがあると思われるないO N ログKが、私は何かを誤解していますか?このため、大きなkに問題があると思います。そうでなければ、対数係数は実用的なアプリケーションでは何もありません。また、このアルゴリズムには大きな隠れた定数はありません。O((nk)klogk)O(nlogk)k

@Saeed:単純なアルゴリズムでは、要素を1つずつ処理します。ステップでは、検索ツリーにx iを追加し、(i > kの場合)検索ツリーからx i kも削除します。これはnステップで、各ステップはO log k 時間かかります。ixii>kxiknO(logk)


@Saeed:ベンチマークでは、中央値を見つけようとさえしなかったことに注意してください。私はやった挿入およびnは、サイズの探索木で削除をK、およびこれらの操作をすることが保証されているO ログK の時間を。ソートと比較して、検索ツリーの操作は実際には非常に遅いことを受け入れる必要があります。バランスのとれた検索ツリーに要素を追加することで機能するソートアルゴリズムを作成しようとすると、これは簡単にわかります。確かにO n log n 時間で機能しますが、実際にはとてつもなく遅くなり、また多くの時間を浪費しますメモリの。nnkO(logk)O(nlogn)



Here's a lower bound from sorting. Given an input set S of length n to be sorted, create an input to your running median problem consisting of n1 copies of a number smaller than the minimum of S, then S itself, then n1 copies of a number larger than the maximum of S, and set k=2n1. The running medians of this input are the same as the sorted order of S.


  • それぞれがk個の要素を持つベクトルを並べ替えます。n/kk
  • 線形時間の後処理を行います。


  • 入力の2つの隣接するブロックbを考えます。両方ともk個の要素があります。要素があること聞かせて12KB 1B 2入力ベクトルxの出現順にb kabka1,a2,...,akb1,b2,...,bkxます。
  • これらのブロックを並べ替えて、ブロック内の各要素のランクを学習します。
  • Augment the vectors a and b with predecessor/successor pointers so that by following the pointer chains we can traverse the elements in an increasing order. This way we have constructed doubly linked lists a and b.
  • One by one, delete all elements from the linked list b, in the reverse order of appearance bk,bk1,...,b1. Whenever we delete an element, remember what was its successor & predecessor at the time of deletion.
  • Now maintain "median pointers" p and q that point to lists a and b, respectively. Initialise p to the midpoint of a, and initialise q to the tail of the empty list b.
  • For each i:

    • Delete ai from list a (this is O(1) time, just delete from the linked list). Compare ai with the element pointed by p to see if we deleted before or after p.
    • Put bi back to list b in its original position (this is O(1) time, we memorised the predecessor and successor of bi). Compare bi with the element pointed by q to see if we added the element before or after q.
    • Update pointers p and q so that the median of the joined list ab is either at p or at q. (This is O(1) time, just follow the linked lists one or two steps to fix everything. We will keep track of how many items are before/after p and q in each list, and we will maintain the invariant that both p and q point to elements that are as close to the median as possible.)

The linked lists are just k-element arrays of indexes, so they are lightweight (except that the locality of memory access is poor).

Here is a sample implementation and benchmarks:

Here is a plot of running times (for n2106):

  • Blue = sorting + post-processing, O(nlogk).
  • Green = maintain two heaps, O(nlogk), implementation from https://github.com/craffel/median-filter
  • Red = maintain two search trees, O(nlogk).
  • Black = maintain a sorted vector, O(nk).
  • X axis = window size (k/2).
  • Y axis = running time in seconds.
  • Data = 32-bit integers and random 64-bit integers, from various distributions.

running times


Given David's bound it's unlikely you can do better worst case, but there are better output sensitive algorithms. Specifically, if m in the number of medians in the result, we can solve the problem in time O(nlogm+mlogn).

O(logm) time. If the new counts indicate that the median is in one of the Fibonacci heaps, it takes an additional O(logn) to pull the new median out. This O(logn) charge occurs only once per median.

If there was a clean way to delete elements without damaging the nice Fibonacci heap complexity, we'd get down to O(nlogm+mlogk), but I'm not sure if this is possible.

Oops, this doesn't work as written, since if you don't delete elements the counts won't reflect the new window. I'm not sure if it can be fixed, but I will leave the answer in case there is a way.
So I think this algorithm may in fact take O(nlogm) if you delete nodes from the Fibonacci heaps, since the Fibonacci heap depth increases only when delete-min is called. Does anyone know nice bounds on Fibonacci heap complexity taking the number of delete-min calls into account?
