PDFドキュメントで使用されている画像圧縮を確認しますか?


回答:


7

pdfimages -list $fileUnix / Linuxシステムで使用できます。Windowsではpopplerをインストールしてツールにアクセスできます(https://en.wikipedia.org/wiki/Pdfimagesを参照)。これはコマンドラインアプリケーションであり、グラフィカルユーザーインターフェイスがないことに注意してください。その出力は次のようになります

page   num  type   width height color comp bpc  enc interp  object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
   1     0 image    1240  1753  gray    1   8  image  no         8  0   150   150  301K  14%
   2     1 image    1240  1753  gray    1   8  image  no        22  0   150   150  281K  13%
   3     2 image    1240  1753  gray    1   8  image  no        36  0   150   150  336K  16%

どこencの列があなたに符号化アルゴリズムを伝え、可能な値はに記載されていますのマンページpdfimages


1
xpdf WebページにWindowsとMacのバイナリが含まれているようです
Yorik

ところで、持っていたpdfimagesのバージョンに「-list」オプションが含まれていなかったので、混乱しました。プロジェクトは2011年にフォークされたことが判明したため、Glyph&CogのxpdfではなくPopplerからのpdf画像が必要になります
cavalcade '25

5

ちょっと。

テキストエディタでPDFを開くと、各画像に対して次のような行が見つかります。

<</Subtype/Image/Length 7986/Filter/FlateDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 368/Height 110/Type/XObject>>stream
...

この画像はFlateDecodeフィルターを使用します。「zlib / deflateアルゴリズム(別名gzip、ただしzipではない)に基づく一般的に使用されるフィルター」

<</Subtype/Image/Length 892/Filter/DCTDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 44/Height 23/Type/XObject>>stream
...

この画像はDCTDecodeフィルター、「JPEG規格に基づく非可逆フィルター」を使用しています

フィルター定義は、サポートされているすべてのフィルターのリストがあるPortable Document Format Wikipedia pageからのものです。

ただし、テキストエディタでどの画像がどの画像であるかを判断するのは難しい場合があります。オブジェクトは必ずしも読み取り順に発生するとは限りません。PDFを1ページに分割すると、ここで役立つ場合があります。

私は考えていないプロのEnfocusピットストップ、Acrobatのプラグインは、十分にそのオブジェクトインスペクタで(、DPIなどの寸法、位置と一緒に)あなたにこの情報を与えるかもしれないが、私はもはやそれを持っており、この特定の一切の言及を見つけることができないようマニュアルの属性。


1
Acrobatには、無数の事前定義済みプリフライトレポートもあります。無料版で利用できるか
どうか不明

PNGもDEFLATE圧縮アルゴリズムを使用することに注意してください(zlibはDEFLATEの実装です)。したがって、最初の例は、圧縮率など、多くの点でPNG画像のようなものと考えることができます。
thomasrutter 2012

@horatio:そうではありません。また、無料版は最近「Adobe Acrobat Reader」ではなく「Adobe Reader」と呼ばれています。
e100 2012

それはAcrobat XかAcrobatZか何かだと思った:)
horatio

1
それは常に混乱しています。現在、Adobe Reader X、Adobe Acrobat X、Adobe Acrobat X Proです。私が本当に困るのは、人々が単一のアプリを意味するときに人々が「アドビ」に言及するときです。
e100
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.