Ubuntuの使用を開始する前に、Nitro PDFリーダーを使用してPDFファイルから画像を自動的に抽出しました。これを行うLinux用のPDFリーダーはありますか?
スナップショットを撮るときよりも速く/簡単に画像を抽出できるようにしたいと思います。
Ubuntuの使用を開始する前に、Nitro PDFリーダーを使用してPDFファイルから画像を自動的に抽出しました。これを行うLinux用のPDFリーダーはありますか?
スナップショットを撮るときよりも速く/簡単に画像を抽出できるようにしたいと思います。
回答:
pdfimages
pdfimages
PDFファイルの画像をPPM、PBM、JPEG、またはJPEG 2000ファイル形式に保存するPDF画像抽出ツールです。
これはpoppler-utils
パッケージの一部であり、インストールする必要があります。
使用法: pdfimages [options] <PDF-file> <image-root>
例:次の例では、PDFファイルからすべての画像を抽出し、JPEG形式で保存します。
pdfimages -j in.pdf /tmp/out
PDFファイルの画像をファイルに保存in.pdf
します/tmp/out-000.jpg
(または/tmp/out-000.pbm
;以下を参照)/tmp/out-001.jpg
など。
pdfimagesのマニュアルページでは、次のことが説明されています。
-j: Normally, all images are written as PBM (for monochrome images) or PPM for
non-monochrome images) files. With this option, images in DCT format are
saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.
-all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
-all
スイッチは、最近のpoppler-utilsリビジョンでのみサポートされていることに注意してください。あなたは12.04に残っている場合たとえば、あなたは、このオプションにアクセスすることはできません
-all
PNM形式のgoを使用できない場合。これらはロスレスであり、PNGなどの画像を後処理できます。
$ pdfimages -list <PDF-file>
「enc」列の元の形式を確認するために使用します。そのため、画像を別の形式に再エンコードする必要はありません。
私はこれによくInkscapeを使用します。ページをロードし、他のすべてのものを削除します。利点は、SVGでベクター画像を取得し、選択に応じて変更できることです。
元の画像がEPSとして提供されたLaTeXで作成された埋め込み画像を含むダブルカラムPDFファイルがあります。に基づいて提案されたソリューションを試しましたpdfimages
が、残念ながら、画像が返されませんでした。その後、Inkscapeを使用しようとしましたが、生成されたSVG画像は歪んでいて、EPSとしてエクスポートすることもできませんでした。
私たちのために働いたソフトウェアはMasterPdfEditorでした。
手順はこちら
結果は非常に高品質ですが、ソフトウェアは無料ではありません。「すべての機能を試すことができます」が、「出力ファイルに透かしを追加する」デモバージョンがあります。率直に言って、私は作成されたPDFに透かしに気付きませんでした。
私はpdfimagesを使用していますが、これはコマンドラインツールであり、私には最適です。非常に使いやすく、--helpオプションを使用して、その使用法について詳しく知ることができます。私はUbuntuを使用しており、プリインストールされています。PDFファイルが暗号化されているかパスワードで保護されている場合、そのためのオプションがあるため、このツールは非常に効果的です。あなたは読むことができ 、より pdfimagesについては こちら
pdfviewerを使用してPDFから画像をトリミングする場合は、okularを試すことができます。あらゆる形式(テキストまたは画像)をpngまたはjpeg形式でトリミングできます。PDFからpng形式の画像を抽出する場合は、pdftohtmlを使用して最小限のコマンドで実行できます。pdfをhtmlと画像に変換します。-ここでは、例を見つけることができますhttps://www.youtube.com/watch?v=CG1rf7k3xo8を。PDFから多くの画像を抽出する場合は、これを試してみることをお勧めします。
pdfimages
NitroPDFよりも、それは/より良いworserのですか?