PDFドキュメントの画像に使用されている圧縮アルゴリズムを見つけることは可能ですか?
PDFドキュメントの画像に使用されている圧縮アルゴリズムを見つけることは可能ですか?
回答:
pdfimages -list $file
Unix / Linuxシステムで使用できます。Windowsではpopplerをインストールしてツールにアクセスできます(https://en.wikipedia.org/wiki/Pdfimagesを参照)。これはコマンドラインアプリケーションであり、グラフィカルユーザーインターフェイスがないことに注意してください。その出力は次のようになります
page num type width height color comp bpc enc interp object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
1 0 image 1240 1753 gray 1 8 image no 8 0 150 150 301K 14%
2 1 image 1240 1753 gray 1 8 image no 22 0 150 150 281K 13%
3 2 image 1240 1753 gray 1 8 image no 36 0 150 150 336K 16%
どこenc
の列があなたに符号化アルゴリズムを伝え、可能な値はに記載されていますのマンページpdfimages
。
ちょっと。
テキストエディタでPDFを開くと、各画像に対して次のような行が見つかります。
<</Subtype/Image/Length 7986/Filter/FlateDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 368/Height 110/Type/XObject>>stream
...
この画像はFlateDecodeフィルターを使用します。「zlib / deflateアルゴリズム(別名gzip、ただしzipではない)に基づく一般的に使用されるフィルター」
<</Subtype/Image/Length 892/Filter/DCTDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 44/Height 23/Type/XObject>>stream
...
この画像はDCTDecodeフィルター、「JPEG規格に基づく非可逆フィルター」を使用しています
フィルター定義は、サポートされているすべてのフィルターのリストがあるPortable Document Format Wikipedia pageからのものです。
ただし、テキストエディタでどの画像がどの画像であるかを判断するのは難しい場合があります。オブジェクトは必ずしも読み取り順に発生するとは限りません。PDFを1ページに分割すると、ここで役立つ場合があります。
私は考えていないプロのEnfocusピットストップ、Acrobatのプラグインは、十分にそのオブジェクトインスペクタで(、DPIなどの寸法、位置と一緒に)あなたにこの情報を与えるかもしれないが、私はもはやそれを持っており、この特定の一切の言及を見つけることができないようマニュアルの属性。