画像PDFファイルを画像として保存するにはどうすればよいですか?


33

文書のスキャン画像を含むPDFがあります。このPDFの内容を画像として保存し、.jpg、.png、および.gifタイプのファイルのみを受け入れるOCRプログラムで実行できるようにします。

このPDFをこれらの画像形式の1つに保存/変換するにはどうすればよいですか?

編集:これを行うことがわかった1つの方法は、各ページをクリックすることです。クリップボードにコピー。Paint.netに貼り付けて保存します。ただし、Acrobat Readerでは一度に1ページしか選択できないように見えるため、これは面倒です。

回答:


20

pooryorickの答え細心の注意を払ってください。彼は、sleskeの答えが実際にこの特定の問題に対してはるかに良い答えであると指摘しています。


GhostScriptを使用します。このコマンドは私のために機能します:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

複数のpng擬似デバイスがあり、色深度で区別します:pngmono、pnggray、png16、png256、png16m、およびpngalpha。最適な方を選択してください。

jpegを使用することもできますが、ディスク領域の問題がない限り、OCRで管理できる限りの高品質が必要です。これはjpegではありません。

GhostScriptはもはやgifをサポートしていませんが、なぜpng256がサポートされているのか、それがなぜ必要なのか想像できません。


私は、Ghostscriptを愛し、あなたはオプションを設定するためのGUIの利便性をしたい場合は、閲覧などGSviewの試みるpages.cs.wisc.edu/~ghost/gsviewを
デニス・

出力は1つの巨大なイメージになりますか?
Xonatron

1
@Xonatron:いいえ。ページごとに1つの画像。%d出力ファイル名には、ページ番号に置き換えられている変数です。(PDF内の数値ではなく、ほぼ確実に生の数値)
wfaulk

20

Imagemagickをインストールします。cmdウィンドウまたはターミナルを開きます。

convert myfile.pdf myfile.jpg

出力は、pdf、test-0.jpg、test-1.jpgなどの各ページに1つのjpgファイルになります。


ImageMagickの場合は+1ですが、間違った仕事のために提案する場合は-2です。JPEGは写真には適していますが、シャープなエッジと高いコントラストがある場合(通常、白い背景に黒いテキスト/文字がある場合)に使用するのに最も悪い形式です。また、ImageMagickは変換作業自体を行わず、バックグラウンドでGhostscriptを「デリゲート」スレーブとして使用します。そのため、Ghostscriptで直接実行すると、使用するパラメーターをより詳細に制御できます。そして、Chrisのために、出力形式としてTIFF(JPEGではなく)を選択します!
カートPfeifle

1
Windowsの場合、Ghostscript 32ビットを最初にインストールしてください。
ユーザー

2
注意してくださいdensitydepthqualityあなたを助けることができるフラグは、自分の出力を最適化します。例:convert -density 300 -depth 8 -quality 85 a.pdf a.png 追加情報
ニック

13

ありますpdfimagesからXpdfのツール(から入手XpdfReaderのサイト)。PDFページ全体を画像に変換するのではなく、PDFから埋め込み画像抽出します。

これは、PDFにテキストと画像が含まれていて、画像のみが必要な場合に便利です。また、画像を元の形式で抽出するため、品質の損失はありません(ページ全体をレンダリングしてからJPEGなどに変換するプログラムとは異なります)。ニーズによっては、これが役立つ場合があります。


簡単な使用法:

pdfimages -j -list mydocument.pdf mydocument-images

これにより、入力ファイルが読み取られ、mydocument.pdfすべての画像が抽出されmydocument-images-0000.jpgmydocument-images-0001.jpgなどの名前の個々のファイルに書き込まれます。

オプション-jにより、埋め込まれたJPEG圧縮画像をPBM / PGM / PPMファイル(非圧縮で巨大なファイル)ではなくJPEGファイルとして書き込むことができます。画像がPDF入力ファイルに保存されている場合、画像は依然としてPBM / PGM / PPMファイルとして書き込まれます。


参考までに、「outputimages-0000.ppm」(または正しい形式の場合は「outputimages-0000.jpg」)を作成する簡単な使用法ですpdfimages -j "yourinputfile.pdf" "outputimages"。.NETの例はここまたはここ
-drzaus

注意点は、JPGとしてファイルを保存することはできないかもしれないが、むしろPPM
drzaus

11

Adobe Readerを使用してこれを行うことができます。

  1. 画像をクリックします。強調表示されます。
  2. コピー(Ctrl-C)し、ペイントに貼り付けます。
  3. 好きなファイル形式で保存します。

2
興味深いのは、Adobe Readerにはスナップショットツールで撮影した画像のdpiを上書きする設定があり、300dpiに設定すると、印刷の準備ができたスナップショットが得られます(デフォルトでは画面解像度が撮影され、通常は低すぎます他の仕事で再利用するため)
スティンサンダース

3
シンプルにするために+1。ほとんどのPDFリーダーでこれを行うことができます。
デシオリラ

4
PDFに10000ページの画像がある場合はどうなりますか?これを10000回行う必要がありますか?
ガイ

9

pdfimagesに言及する回答を除いて、他のすべての回答は、そのソリューションが実際に埋め込まれた画像をトランスコードすることに言及することに失敗します。つまり、これらのソリューションは、元の画像を単に抽出するのではなく、処理中に画像を変更する可能性があります。pdfimagesのみが元の画像を抽出します。これは、Ghostscript、Imagemagick、Adobe Reader、PDFFill、PDF Xchange Viewer、OS X Preview、および他のほとんどのPDFソフトウェアに当てはまります。


質問のコンテキストを考えると、これは実際には非常に良い点です。
wfaulk

FWIWの「PDFill PDF Tools」を使用すると、画像として保存するDPIを設定できます。したがって、各ページ(テキスト、画像、あらゆるオブジェクトから始まる)は、たとえば4961x6520の高解像度PNGに保存されます。
クリスO

4

PDFill PDF Toolsは、おそらくWindowsでPDFを画像に変換する簡単な方法です。PDFのすべてのページをエクスポートして、1回のショットで別々の画像を作成できます。また、無料で利用できる他の多くの機能もあります。これらは、商用版または「Pro」版を購入した場合にのみ、他のPDFビューアで利用できます。

以下のスクリーンショットの「PDFを画像に変換」ボタン(ボタン#10)を使用します。

PDFill PDF Toolsスクリーンショット

画像を1つの非常に背の高い画像に連結して、OCRプログラムに1つのファイルだけを送る必要がある場合、IrfanViewを使用できます。


これにより、システムに2つの異なるツールがインストールされることに注意してください。主なものはPDFill Editorで、これは必要ありません。スタートメニューに移動して、これを開きます。アンインストールする前に何かがおかしいことに気付いて、スクリーンショットに保存されました。
ufotds

はい、PDFill EditorのシェアウェアバージョンとPDFプリンターもインストールすることに言及しなかったと思います。PDFill Editorで作成されたファイルには、エディターを19.99ドルで購入しない限り透かしが入りますが、PDFill PDF Tools Freeユーティリティでは購入する必要はありません。私が持っているバージョンでは、PDFill PDF Tools FreeもアンインストールせずにPDFill Editorをアンインストールすることはできませんが、PDFill Editorをインストールしても何の害もありません。
ロブ・

2

OSタグを含めなかったため、OSXの回答を含めます。

PDFはデフォルトでPreview.appで開き、以下を使用できますFile -> Save-As

  • GIF
  • ICNS
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • フォトショップ
  • PNG
  • TGA
  • TIFF

1

また、PDF Xchange Viewer(無料)はファイルへのエクスポートを行います。ファイル→エクスポート→イメージにエクスポート。

それだけでなく、Windows用の最高の無料PDFビューアであり、優れたマークアップ機能を備えている思います。私はAdobe Acrobatのライセンスを持っていますが、大規模な編集を行っている場合を除き、まだこれを好みます。


これは、画像にエクスポートするオプションがパスワードで保護されたPDFに対して無効になっていることを発見するまで、有望に見えました。
ミッチ

1

(非無料)Acrobatプロフェッショナルはこれを行います:

詳細設定->ドキュメント処理->すべての画像をエクスポート...


0

ファイルが5MB未満で、プライバシー/機密性について心配していない場合は、http://www.go2convert.com/の便利なオンラインサービスで、多くのグラフィック変換(pdfからjpegへ)を実行できます


試したところ、「申し訳ありません。この画像は正しく変換できませんでした」というエラーメッセージが表示されました。
ガイ

-1

画像が画面のサイズを超える場合、FastStone Capture(「キャプチャスクロールウィンドウ」機能)を使用して、画像をJPEGとして保存できます。

代替テキスト


これは画像を取得する非常に回り道な方法です。OPにはすでにより良い解決策があります(Acrobatのマークページ)。
-sleske

-1

あなたは、チェックアウトすることができますこの記事を

PDFを画像に変換する6つの異なる方法をリストします。

PDFからJPGへの変換(The Web Way)

デスクトップ用のPDFからJPGへのコンバーター


えーと。どうしてダウン投票したの?
-noob
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.