Linux用のどのファイル圧縮ソフトウェアが最大のサイズ削減を提供しますか?[閉まっている]


51

私は大量のファイル圧縮を行います。私が圧縮しているもののほとんどは単なるコードなので、損失の少ない圧縮を使用する必要があります。7zipよりも優れたサイズ削減を提供するものがあるかどうか疑問に思っていました。重要なのは、サイズを圧縮または解凍するのにかかる時間です。Linuxでこのようなソフトウェアを知っている人はいますか?または、7zipが最適ですか?

回答:


37

7zip圧縮機よりも圧縮機(PKZIPなど)です。Linuxで利用できますが、圧縮されたアーカイブは通常のファイルにしか作成できません。たとえば、ストリームを圧縮することはできません。所有権、ACL、拡張属性、ハードリンクなどのUnixファイル属性のほとんどを保存することはできません...

Linuxでは、としてコンプレッサー、あなたが持っているxzのと同じ圧縮アルゴリズムを使用する7zip(LZMA2)。これを使用して、tarアーカイブを圧縮できます。

以下のためのようにgzipしてbzip2、そこですパラレルバリアントpixz圧縮をスピードアップするために複数のプロセッサを活用することができます(xzまたしてバージョン5.2.0以降でネイティブにそれを行うことができます-Tオプション)。このpixzバリアントは、圧縮されたアーカイブのインデックス作成もサポートしtarています。つまり、最初からファイルを解凍することなく単一のファイルを抽出できます。


6
ここで作成している「コンパクター」と「コンプレッサー」の違いを拡大できますか?
mattdm 14年

2
@mattdm、コンプレッサーは圧縮のみ、コンパクターはいくつかのものを圧縮アーカイブに圧縮します。
ステファンシャゼル14年

2
@mattdm、奇妙な。これは、90年代の非常に一般的な用語であり、グーグル検索のように見えますが、もはや違います。
ステファンシャゼル14年

6
たぶんそれはDOSのものだったのでしょうか?Unixでは、圧縮とアーカイブの区別は一般的に行われます(おわかりのように)が、「コンパクター」と聞いたことはありません。
mattdm 14年

1
@mattdm、まあ、compactはarchive + compress(おそらくインデックス付け、場合によっては個別に圧縮される)であり、アーカイブは圧縮を意味しません。これはDOSのものではありませんが、おそらくフランス語のものでした。usenetアーカイブをグーグルで検索すると、自分の記事にしか出会っていないようです。
ステファンシャゼル14年

65

lrzipは、特にソースコードを圧縮している場合に、本当に探しているものです!

READMEを引用:

これは大きなファイル用に最適化された圧縮プログラムです。ファイルが大きく、メモリが多いほど、特にファイルが100MBを超えると、圧縮の利点が大きくなります。利点は、サイズ(bzip2よりもはるかに小さい)または速度(bzip2よりもはるかに速い)を選択できます。[...] lrzipのユニークな機能は、最大限のメリットを得るために、システムで利用可能なRAMを常に最大限に活用しようとすることです。

lrzipは、最初にrzipベースのアルゴリズムで長距離データの冗長性をスキャンして削除し、次に非冗長データを圧縮します。

Con Kolivasは、Linuxカーネルメーリングリストで素晴らしい例を提供しています。40の Linuxカーネルリリースの10.3GBのtarball を163.9MB(1.6%)まで圧縮し、xzよりも高速に圧縮します。彼は最も積極的なセカンドパスアルゴリズムを使用していませんでした!

ソースコードの巨大なtarballを圧縮すると素晴らしい結果が得られると確信しています:)

sudo apt-get install lrzip

例(他のオプションにデフォルトを使用):

超圧縮、ドッグスロー:

lrzip -z file

フォルダについてはlrziplrztar


1
また、圧縮されたシステムファイルツリーのlrzipバックアップにも非常に優れた機能を発揮しtar/cpio/paxます。これには通常lrzip、圧縮に非常に優れた長距離の冗長性が多く含まれているためです。
フランキー14年

10
私が試したlrzippixz19ギガバイトのテキストファイルに。両方とも(ヘキサコアマシンで)圧縮に約30分かかりましたが、lrzファイルはファイルの半分のサイズでしたxz(2.7対4.4 GB)。そのため、代わりにこの回答に別の票を投じます。
fnl

3
「コンテスト」による@フランキー、「アテスト」という意味ですか?
ミッチ

Pied Piperのように感じます!
デニス・ビタリ

1
lrzipとrzipの違いを知っていますか?rzipは1998年にリリースされたようで、長距離冗長性を備えた非常に大きなファイルで最適に動作するように設計されているため、lrzipに似ているように聞こえます。(からrzip rzip.samba.org
アスタラ

6

圧縮速度に関係なく最大のサイズ削減を探している場合LZMAは、おそらく最適なオプションです。

さまざまな圧縮を比較する場合、一般的にトレードオフは時間とサイズです。gzip良好な圧縮率を実現しながら、比較的迅速に圧縮および解凍する傾向があります。圧縮時間と圧縮解除時間の両方bzip2よりやや遅いですがgzip、圧縮率はさらに高くなります。LZMAの圧縮時間は最も長くなりますが、最適な比率が得られますが、圧縮率はの圧縮率よりも優れていbzip2ます。

出典:http : //bashitout.com/2009/08/30/Linux-Compression-Comparison-GZIP-vs-BZIP2-vs-LZMA-vs-ZIP-vs-Compress.html

http://tukaani.org/lzma/benchmarks.html


1
これに反対する必要があります!GNU / Linuxで動作する圧縮速度に関係なく最大の縮小率を提供するロスレスファイルコンプレッサーは、おそらくzpaqまたはpaq8lです。ただし、それらは非常に遅いため、ほとんどの実際の使用法では実用的ではありません。
フランキー14年

冷却@Franki sudo apt-get install zpaq、私は、いくつかのテストをしたによるとウィキ、そのアプリは、最新の2009年になりますが、それはまだのために失うKGB ...(その用途のPAQ6)が、KGBが非常に遅い
水瓶座パワー

@フランキーは実際に、私はちょうどzpaq pvc/usr/share/doc/zpaq/examples/max.cfg file.zpaq file.tarより多くを圧縮することがわかったkgb -9
アクエリアスパワー

4

(更新された回答)時間が重要でない場合は、ZPAQ v1.10(またはそれ以降)を使用し
zpaq pvc/usr/share/doc/zpaq/examples/max.cfg file.zpaq file.tar ます。例:(max.cfgファイルの場所は異なる場合があります。インストールされているパッケージファイルリストを確認してください)

zpaq実際にはを超える圧縮kgb -9 newFileName.kgb yourFileName.tar
それは古いアルゴリズムPAQ6に基づいており、非常に遅いです...
7zip、lrzip、bzip2、kgb ..、zpaqなど、他のすべての圧縮機でテストしました。

kgbそれでも興味がある場合:(この回答の最初の選択でしたので、ここに情報を保持しています)
Ubuntu 14.04にはkgb 1.0b4がありsudo apt-get install kgbインストールするために実行されます。

以下はkgb、Linux上で実行/コンパイルを試みることができるWindowsバージョンですが、成功しませんでした。
バージョン2 beta2はSourceForgeにありますが、Linuxバイナリはありません。を使用してコンソールで実行してみることができますwine kgb2_console.exe -a7 -m9-a6 -m9メソッドは1.0b4の最良のメソッドと同等であるようで、-a72 beta2で新しく追加されました)。winetricksを使用して.NET 2.0をインストールして実行することで安定性は向上しましたがwine "KGB Archiver 2 .net.exe"(少ししたくないので、2 beta2とほぼ同じ結果が得られるネイティブLinux 1.0b4に固執します)。
とにかく、バージョン2 beta2はLinuxネイティブバージョンにも真剣に値します!たぶん何かが見る、MinGWので達成することができ、これを、このコマンドは、まだひどく失敗します。i586-mingw32msvc-g++ kgb2_console.cpp -o kgbdmcs(Mono)でコンパイルしようとするかもしれませんか?このヒントを参照してください。


2

7zipはユニークなテクノロジーではありませんが、いくつかの異なる圧縮方法をサポートしています(その上でウィキペディア7zを参照してください)。

テストのセットは、特別にCソース・ファイルのためのさまざまなツールを用いて行きました。Linux用のツールがまだ存在するかどうかはわかりません。ただし、最適なアルゴリズムは変更を加えたPPM(PPMII、次にPPMZ)であることに注意してください。

ツールに興味がある場合は、サイトを閲覧できます。ロシア語ですが、Google翻訳が役立つ場合があります。本当に必要な場合は、Linuxからwineを使用する(またはできない)バイナリ大量にあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.