ハフマン型マージソートの元の参照？

マージソートの最適化の概念の最初の出版物は何ですか

線形時間で増加する順序（別名実行）での連続した位置のシーケンスを識別します。その後
そのような2つの最短シーケンスを繰り返しマージし、このマージの結果をソートされたフラグメントのリストに追加します。

一部の出版物（例：http : //barbay.cl/publications.html#STACS2009、http: //barbay.cl/publications.html#TCS2013）では、このトリックを使用してソートを高速化し、圧縮データ構造を生成しました順列。

このトリックは以前に、ソートの高速化というコンテキストで導入されたようですが、私も私の生徒も参照を見つけることができませんでしたか？

reference-request sorting huffman

— ジェレミー
ソース

クヌースをチェックしましたか？TAOCPでかなりの実行があったことを覚えています。

— Mikolas

n / 2

$n/2$

ρ

$\rho$

n (1 + \lg ρ)

$n(1+\lg\rho)$

(n_{1}, \dots, n_{ρ})

$(n_1,\ldots,n_\rho)$

n (1 + 2 H (n_{1}, \dots, n_{ρ}))

$n(1+2H(n_1,\ldots,n_\rho))$

O (n (1 + l g (r + 1)))

$O(n(1+lg(r+1)))$

結果は不明瞭な4pテクニカルレポートに隠されていました。他の人が興味を持っている場合に備えて、ここで結果を共有します。

Knuthは、「自然なマージソート」（第3版の本3の160ページ）の説明でランについて言及していますが、複雑さを平均でのみ分析し（n / 2ランを生成します）、数ρの関数ではありません走る
Mannilaは1985年に、N（M（1 + lg（r + 1）））内でNatural Mergesortがn要素をソートしてrランを形成するのに時間がかかることを証明しました。
$n(1+2H(n1,…,nρ))$
2009年に、この手法はシンポジウムMathematical Fundation of Computer Scienceで（並べ替え、最短パス、最小全域木に関する結果とともに）発表されました。
2010年に、情報処理ジャーナルに「エントロピーとしての計算の複雑さ」というタイトルで、共著者の中川雄二氏（https://www.semanticscholar.org/author/Yuji-Nakagawa/2219943）が追加されました。。

以下のbibtexリファレンスに参加します。

@TechReport {1997-TR-MinimalMergesort-Takaoka、author = {Tadao Takaoka}、title = {Minimal Mergesort}、institution = {University of Canterbury}、year = 1997、note = { http://ir.canterbury.ac。 nz / handle / 10092/9676、最後にアクセス[2016-08-23 Tue]}、abstract = {最小適応ソートと呼ばれる新しい適応的ソートアルゴリズムを提示します。これは、入力リストの昇順の実行を短いものから長いものにマージします。つまり、最も短い2つのリストを毎回マージします。このアルゴリズムが、エントロピーと呼ばれる事前ソートの新しい尺度に関して最適であることを示します。}}

この論文では、部分的に解決された入力データS（X）=（X 1、...、X k）の不確実性に対するエントロピーH（S）の測定値を紹介します。ここで、Xはデータセット全体であり、各X iはすでに解決しました。エントロピー測定を使用して、ソート、最短パス、および最小全域木という3つの例の問題を分析します。ソートの場合、X iは昇順の実行であり、最短経路の場合、X iは与えられたグラフの非循環部分です。最小全域木では、X iは部分グラフに対して部分的に取得された最小全域木として解釈されます。エントロピー尺度H（S）は、pi = | X i | / | X |を考慮して定義されます。確率尺度として、つまり、H（S）= −nΣki= 1pilogpi、ただしn =Σki= 1 | Xi |。次に、入力データS（X）をO（H（S））時間でソートし、O（m + H（S））時間で最短経路問題を解くことができることを示します。ここで、mはエッジの数です。グラフ。

@article {2010-JIP-EntropyAsComputationalComplexity-TakaokaNakagawa、author = {Takao Takaoka and Yuji Nakagawa}、title = {Entropy as Computational Complexity}、journal = jip、volume = {18}、pages = {227--241}、year = {2010}、url = { http://dx.doi.org/10.2197/ipsjjip.18.227}、doi = {10.2197 / ipsjjip.18.227}、timestamp = {2011年9月14日水曜日13:30:52 +0200 }、biburl = { http://dblp.uni-trier.de/rec/bib/journals/jip/TakaokaN10}、bibsource = {dblp computer science bibliography、http: //dblp.org}、abstract = {特定の問題インスタンスが部分的に解決されている場合、その情報を使用して問題を解決するための努力を最小限に抑えたいと考えています。このペーパーでは、部分的に解決された入力データS（X）=（X1、。。、Xk）の不確実性に対するエントロピーH（S）の測定を紹介します。ここで、Xはデータセット全体であり、各Xiは既に解決しました。Xiを繰り返しマージし、kが1になると終了する一般的なアルゴリズムを提案します。エントロピー測定を使用して、ソート、最短パス、最小スパニングツリーの3つの例の問題を分析します。ソートの場合、Xiは昇順の実行であり、最小スパニングツリーの場合、Xiはサブグラフの部分的に取得された最小スパニングツリーとして解釈されます。最短経路の場合、Xiは与えられたグラフの非循環部分です。kが小さい場合、グラフはほぼ非循環と見なすことができます。エントロピー測定、H（S）、は、pi = ¦Xi¦ / ¦X¦を確率測度と見なして定義されます。つまり、H（S）= -n（p1 log p1 +。。+ pk log pk）で、n = ¦X1¦ +です。。。+ ¦Xk¦。入力データS（X）をO（H（S））時間でソートできること、および最小コストスパニングツリーをO（m + H（S））時間で完了することができることを示します。エッジの。次に、O（m + H（S））時間で最短経路問題を解きます。最後に、パーティショニングプロセスにデュアルエントロピーを定義します。これにより、一般的なクイックソートの時間制限と、別の種類のほぼ非循環的なグラフの最短経路問題が得られます。} ここで、mはエッジの数です。次に、O（m + H（S））時間で最短経路問題を解きます。最後に、パーティショニングプロセスにデュアルエントロピーを定義します。これにより、一般的なクイックソートの時間制限と、別の種類のほぼ非循環的なグラフの最短経路問題が得られます。} ここで、mはエッジの数です。次に、O（m + H（S））時間で最短経路問題を解きます。最後に、パーティショニングプロセスにデュアルエントロピーを定義します。これにより、一般的なクイックソートの時間制限と、別の種類のほぼ非循環的なグラフの最短経路問題が得られます。}
}

— ジェレミー
ソース