PDFファイルで画像の解像度を確認しますか?


15

一部のユーザーが非常に大きなPDFを作成するという問題があります。一方、ファックス機から送信されたPDFは、サイズが小さく、完全に印刷可能です。私の質問は

  • PDFの解像度(DPI)を見つける方法はありますか。インターネットで検索しましたが、答えが見つかりませんでした。ファイルのプロパティを確認しましたが、少なくとも私の場合、この情報はそこに保存されていませんでした。
  • テキストファイルを画像PDFに変換する最適な解像度は何ですか。96dpi、300dpi以上?
  • 楽しい質問。高dpiでスキャンされたPDFを小さなdpiにサイズ変更できますか?

私はすでにインターネットを検索していて、答えを見つけることができなかったので、いくつかの答えが利用できないかもしれないことを知っています。

注:私のPDFは完全に画像、テキストから画像です。私はprimoPDF(無料)を試してみることもできます。

回答:


18

slhckの回答とscrussのコメントは更新に値する:pdfimages今(少なくともバージョン0.26.5以降)明示的にリストx-ppiy-ppi。出力例を次に示します。

$ pdfimages -list example.pdf 
page   num  type   width height color comp bpc  enc interp  object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
   1     0 image    2244  2244  cmyk    4   8  image  no       215  0   301   301  418K 2.1%
   2     1 image     900   600  rgb     3   8  image  no       324  0  1524  1525 35.5K 2.2%

Debian(Wheezy)およびFedora(23)ではpdfimagespoppler-utilsパッケージの一部です。


私のものはすべて空です
-theonlygusti

8

画像データを抽出したくないことは知っていますが、おそらくこれが元の解像度を見つける唯一の方法です。


* nixで、ImageMagick identifyXpdfがインストールされている場合1

pdfimages -j test.pdf test && for file in $(find . -name "test*.jpg"); do identify "$file"; done

test.pdf入力PDFはどこにありますか。出力ファイルはに書き込まれtest-000.jpgtest-001.jpgエトセトラ、。これにより、PDF 2に含まれるすべての画像の元のサイズが得られます。

1つの大きな画像のみを含むPDFファイルの出力例:

./test-000.jpg JPEG 2500x1961 2500x1961+0+0 8-bit DirectClass 1.022MB 0.000u 0:00.000

1)Windowsにもこれらがありますが、もちろんスクリプトは異なります。
2)画像には実際にはDPI情報が含まれていないことに注意してください。簡単に言えば、それは単に印刷に使用されるものであり、画像はDPIの固有の測定値を必要としません。


テキストファイルを画像PDFに変換する最適な解像度は何ですか。96dpi、300dpi以上?

通常、印刷するものはすべて300dpi以上である必要があります。ほとんどのプリンターも高解像度を処理します。


2
popplerプロジェクトのpdfimages(おそらく元の質問よりも新しいバージョン)には、-listオプションが追加されていますpdfimages -list test.pdf。ファイルを出力するのではなく、サイズと画像タイプをリストします。それでも明示的に解決策を提供するわけではありませんが、出力ファイルの作成は避けます。
スクルース

1
@scrussバージョン0.34.0以降、pdfimages -list明示的にx-ppiおよびy-ppi、その他の多くの情報を提供します。
スキッピールグラングロウ

実際、@ SkippyleGrandGourouが実際に実行します。質問が行われてから約5年後です。ただし、pdfimagesは、抽出した画像にその解像度/サイズを適用しません。
スクルース

@scruss実際には、によって与えられる解像度pdfimagesはかなりオフになっているようです(たとえば、によって生成されたPDFで、画像がその可視領域よりも大きい場合scribus)。(残念ながら、今はバグレポートを提出する時間がありません。)
Skippy le Grand

4

何らかの理由で、CentOSでアップグレードできるpdfimagesの最新バージョンはバージョン3.04です。

したがって、以前の回答で述べたように、-listオプションはありません。ただし、shlckの回答に基づいてpdfimagesから作成されたテストイメージには、目的の回答が含まれています。

特定-verbose test-0000.jpg | もっと

Image: test-0000.jpg  
Format: JPEG (Joint Photographic Experts Group JFIF format)  
Mime type: image/jpeg  
Class: DirectClass  
Geometry: 6600x5100+0+0  
Resolution: 600x600  
Print size: 11x8.5

そのため、識別コマンドの-verboseオプションを使用して、6行目にdpiを明示的に表示します。

したがって、shlckの答えは次のように変更できます。

pdfimages -j test.pdf test && for file in $(find。-name "test * .jpg"); -verbose "$ file"を識別します| awk 'NR == 6'; やった

別の注意として、私は走ってみた

特定-verbose test.pdf

Format: PDF (Portable Document Format)  
Mime type: application/pdf  
Class: DirectClass  
Geometry: 792x612+0+0  
Resolution: 72x72  
Print size: 11x8.5  

Imagemagickは常に72dpiを想定しているため、ここに印刷された情報は間違っているようです。


1

PDFファイルには固有の解像度はありません。PDFファイル内の各ラスターイメージ(ある場合)は、独自の解像度を持ちます。埋め込み画像XObjectの中央値/モーダル解像度の単一の数値を抽出する簡単な方法は知りません。


ちなみに、pdfから画像データを抽出することに興味はありませんが、スキャン解像度とは何かを知りたいのですが、それが非常に高い場合は将来的にそれを避けたいと思います。
hk_

@Dave:実際には、画像を抽出するのではなく、埋め込み画像に関する情報を抽出することを意味しました。しかし、shlckの答えはあなたの問題を解決するかもしれません。
RedGrittyBrick

1

これは、京セラmfpから生成されたpdfで機能しました...これは、おそらくスキャンのような全ページ画像にのみ有効です。

  1. リーダー付きPDFを開きます-
  2. [ファイル]> [プロパティ]-[説明]タブ-ページサイズ。私の例では、8.5x11.0インチと述べています。

  3. 、テキストエディタ(メモ帳)でPDFを開き、探し/width/height

  4. 高さと幅を取得し、それらをページの高さと幅(インチ単位)で割る

例:

5100/8.5=600
6600/11.0=600

PDFは600x600の解像度でスキャンされました。

ドキュメントサイズがわかっている場合は、最初の2つの手順をスキップできます(通常、A4は8.27x11.69です)。


0

2番目のポイントに答えるために、@ slhckのプリンターdpiに関する言及に加えて、300dpiは、フォントサイズが10 + ptのOCRの典型的な最小推奨数でもあります。

さらに、最新の15インチ4Kノートパソコンの画面には約280PPiしかありません。そのため、画面(風景)でA4全体を表示したい場合、それ以上のドキュメントは320 dpi以上でスキャンされません。もちろん、ズームインするかどうかは関係ありませんが、より高いdpiが必要になる場合があります。

他の2つの点に答えるために、最近では少なくともAcrobat Proを使用して画像のDPIと解像度を確認し、編集することもできます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.