最大の圧縮を得るために7zipファイルを作成するときに使用する設定は何ですか?スキャンした画像を含むPDFドキュメントを圧縮しています。LZMA2の使用を考えていますが、辞書のサイズや単語のサイズなどを設定する方法がわかりません。また、LZMAまたはPPMdの方が良いオプションでしょうか。
ネット経由でいくつかのファイルを転送する必要があり(〜200MiB)、ここでのアップロード速度は非常に遅いため、可能な限りデータを圧縮したいと思います。消費されるCPU時間はそれほど重要ではありません。
編集
さまざまな圧縮方法をテストした結果、次のようになりました。
非圧縮サイズ:25,462,686B
私のプロセッサーはIntel Core 2 Due T8100であり、4GiBのRAMがあります。
最高の圧縮は、PAQ8Oアルゴリズムを使用したPeaZipで行われました。結果のファイルサイズは19,994,325Bでした。使用された設定は圧縮レベル:最大です。残念ながら、圧縮速度は約5KiB / sであったため、データを圧縮するのに1時間以上かかりました。
次は実験的なPAQ9Oコンプレッサーでした。それを使用して、約3分の圧縮で20,132,660Bを得ました。残念ながら、プログラムはコマンドラインのみであり、他の多くのプログラムはその圧縮アルゴリズムを使用していません。また、使用した設定で約1.5GiBのRAMを使用します(a -9 -c)
その後、LZMA2を使用した7-Zip 9.15ベータ版(2010-06-20)になりました。それを使用して、約3分で20,518,802Bを得ました。使用した設定はワードサイズ273、辞書サイズ64MBで、圧縮には2つのスレッドを使用しました。
さて、私の元の質問に戻ります。私の場合、固体ブロックサイズは目立った結果を生成しませんでした。ワードサイズを大きくすると、いくつかの結果が得られました。最高の単語サイズと最小の単語サイズの差は115,260Bでした。このような節約は、必要な2回のクリックを行い、単語サイズを変更するために必要な努力を正当化するものだと思います。
7zipおよびPeaZipでサポートされている他の圧縮アルゴリズムを使用してみたところ、19.8MiBから21.5MiBのサイズのファイルが生成されました。
最終的に私の結論は、ほとんどが画像を含むPDF文書を圧縮する場合、エキゾチックな圧縮アルゴリズムを使用するのに必要な労力は正当化されないということです。7zipのLZMA2を使用した圧縮は、最小限の時間で非常に受け入れられる結果をもたらしました。