PDFを圧縮するときに最大の圧縮を得るために7zipファイルを作成するときに使用する設定は何ですか?


15

最大の圧縮を得るために7zipファイルを作成するときに使用する設定は何ですか?スキャンした画像を含むPDFドキュメントを圧縮しています。LZMA2の使用を考えていますが、辞書のサイズや単語のサイズなどを設定する方法がわかりません。また、LZMAまたはPPMdの方が良いオプションでしょうか。

ネット経由でいくつかのファイルを転送する必要があり(〜200MiB)、ここでのアップロード速度は非常に遅いため、可能な限りデータを圧縮したいと思います。消費されるCPU時間はそれほど重要ではありません。

編集

さまざまな圧縮方法をテストした結果、次のようになりました。

非圧縮サイズ:25,462,686B

私のプロセッサーはIntel Core 2 Due T8100であり、4GiBのRAMがあります。

最高の圧縮は、PAQ8Oアルゴリズムを使用したPeaZipで行われました。結果のファイルサイズは19,994,325Bでした。使用された設定は圧縮レベル:最大です。残念ながら、圧縮速度は約5KiB / sであったため、データを圧縮するのに1時間以上かかりました。

次は実験的なPAQ9Oコンプレッサーでした。それを使用して、約3分の圧縮で20,132,660Bを得ました。残念ながら、プログラムはコマンドラインのみであり、他の多くのプログラムはその圧縮アルゴリズムを使用していません。また、使用した設定で約1.5GiBのRAMを使用します(a -9 -c)

その後、LZMA2を使用した7-Zip 9.15ベータ版(2010-06-20)になりました。それを使用して、約3分で20,518,802Bを得ました。使用した設定はワードサイズ273、辞書サイズ64MBで、圧縮には2つのスレッドを使用しました。

さて、私の元の質問に戻ります。私の場合、固体ブロックサイズは目立った結果を生成しませんでした。ワードサイズを大きくすると、いくつかの結果が得られました。最高の単語サイズと最小の単語サイズの差は115,260Bでした。このような節約は、必要な2回のクリックを行い、単語サイズを変更するために必要な努力を正当化するものだと思います。

7zipおよびPeaZipでサポートされている他の圧縮アルゴリズムを使用してみたところ、19.8MiBから21.5MiBのサイズのファイルが生成されました。

最終的に私の結論は、ほとんどが画像を含むPDF文書を圧縮する場合、エキゾチックな圧縮アルゴリズムを使用するのに必要な労力は正当化されないということです。7zipのLZMA2を使用した圧縮は、最小限の時間で非常に受け入れられる結果をもたらしました。


PeaZipの使用の違いは何ですか?これは、7zipやその他の多くのツールのGUIラッパーにすぎません
コールジョンソン

@Cole "Cole9" Johnson違いは、私の場合は、当時GUIを持っていなかったPeaZipの「他の」ツールをいくつか使用したことです。正しく覚えていれば、PeaZipのみがGUIを備えたPAQ8Oアルゴリズムを提供していました。
AndrejaKo

回答:


8

PDF(テキストと画像)のコンテンツはおそらく既に圧縮されているので、再度圧縮しようとしてもそれほど多くは得られません。


3
うーん、ダメ。私は少しテストを行い、24MiBのPDFを取得し、デフォルト設定を使用してそれらを圧縮しました。結果は19 MiBファイルでした。私の場合、これらの5 MiBは私の場合問題になります。
AndrejaKo

1
あなたは正しいようです。何をしても、7zipのデフォルトよりもはるかに良い結果を出すことはできませんでした。圧縮は、圧縮しないよりも優れていると確信しています。
AndrejaKo

3
十分なスペースを節約できる場合は、7-Zipを使用せずにほとんどすべてのスペースを節約するためにPDF自体で実行できる作業がおそらくあります。AcrobatのPDFオプティマイザーを使用すると、驚くべき結果が得られます。
afrazier

usrの回答を参照してください-PDF(zlib)で使用されている圧縮を元に戻して、さらに圧縮することができます(再構築時に再び適用されます)。これにより多くの場合、サイズが約50%縮小されます
schnaader

@schnaader:それは本当に面白いです。AcrobatのPDF OptimizerやMuPDFなどのツールを使用して、PDFを表示可能な状態に保ちながら変更しましたが、そのようにロスレスに変換できることも非常に価値があり、非常に有利に使用できます。
afrazier

7

precompを試してください-まず、PDF内の既に圧縮されたデータを解凍します。その後、7zは非圧縮データに対して魔法をかけることができます。

また、非常に効果的でありながら非常に効率的であることが確認されているnanozipを試してください(PAQアルゴリズムの圧縮率で400kb / s)。


2

7za a -t7z -mx-9 -mfb = 258 -mpass = 15 filename.7z subdir

コマンドラインの実行可能ファイルの名前に必要に応じて最初の単語を調整し、「-mpass = 15」の後の部分を調整して、ファイル名とその内容をカスタマイズします。

この回答は、PDFドキュメントに固有のものではありません。
これは、PPMではなくLZMAを使用します。他のバリエーションと互換性のないバリエーションが多すぎるため、私はPPMから離れました。LZMAはより安定しており、互換性がより広くサポートされています。あなたが述べたように、私の意見は「エキゾチックな圧縮アルゴリズムを使用するのに必要な努力は正当化されない」という理由で、私はまさにPPMから離れました。


2
LZMA2はLZMAよりも大幅に優れていますが、64ビットシステムでのみ(効果的に)使用するためのものです。
大丸有

-3

高い圧縮率でsfxファイルまたはmsiパッケージを作成できるため、lzma圧縮が最適です。あなたの場合、大きなファイルを圧縮していないので、特にファイルが次のように圧縮されている場合、差分は非常に小さくなります:mp3またはpng

無料でアークを勝ち取ろう

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.