PDFから埋め込み画像を抽出する

165

Ubuntuの使用を開始する前に、Nitro PDFリーダーを使用してPDFファイルから画像を自動的に抽出しました。これを行うLinux用のPDFリーダーはありますか？

スナップショットを撮るときよりも速く/簡単に画像を抽出できるようにしたいと思います。

software-recommendation

— 1kb
ソース

NitroPDFがベクター画像でどれだけうまく処理できたか思い出せますか？することができますpdfimagesNitroPDFよりも、それは/より良いworserのですか？

— レオレオポルドヘルツ

2

PDFから画像を一括抽出するため

— ファンキーな未来

2

@ funky-future明らかに2つの質問は重複していますが、重複したターゲットには2つの回答しかなく、これらの2つの回答の1つはスパム回答です。

— -karel

197

つかいます `pdfimages`

pdfimages PDFファイルの画像をPPM、PBM、JPEG、またはJPEG 2000ファイル形式に保存するPDF画像抽出ツールです。

これはpoppler-utilsパッケージの一部であり、インストールする必要があります。

使用法： pdfimages [options] <PDF-file> <image-root>

例：次の例では、PDFファイルからすべての画像を抽出し、JPEG形式で保存します。

pdfimages -j in.pdf /tmp/out

PDFファイルの画像をファイルに保存in.pdfします/tmp/out-000.jpg（または/tmp/out-000.pbm;以下を参照）/tmp/out-001.jpgなど。

pdfimagesのマニュアルページでは、次のことが説明されています。

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.

— pl1nk
ソース

8

ネイティブ形式で画像を抽出するソリューションがあると便利です。JPEGの再エンコードは実際には理想的ではありません。

— クリスチャン

32

manページの

-all   Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files.  This is equivalent  to  specifying  the options -png -tiff -j -jp2 -jbig2 -ccitt.

— @Christian

2

この-allスイッチは、最近のpoppler-utilsリビジョンでのみサポートされていることに注意してください。あなたは12.04に残っている場合たとえば、あなたは、このオプションにアクセスすることはできません

— Glutanimate

1

-allPNM形式のgoを使用できない場合。これらはロスレスであり、PNGなどの画像を後処理できます。

— トマスガンドール

1

@Christian、$ pdfimages -list <PDF-file>「enc」列の元の形式を確認するために使用します。そのため、画像を別の形式に再エンコードする必要はありません。

— ホセバラカット

24

私はこれによくInkscapeを使用します。ページをロードし、他のすべてのものを削除します。利点は、SVGでベクター画像を取得し、選択に応じて変更できることです。

— グレムリン
ソース

一部のPDFは、Inkscape内部インポートでのみ適切にインポートできます（poppler / cairo importまたはpdfimageは適切に解析できません）。インポートしたら、イメージをコピーして新しいファイルに貼り付け、ページのサイズを選択して選択しますgraphicdesign.stackexchange.com/a/21638/95041

— sdaffa23fdsf

私にとっては問題ありません。それが最良の解決策でした。一度に1ページずつ選択する必要があることに注意してください。

— ジミーオラノ

5

元の画像がEPSとして提供されたLaTeXで作成された埋め込み画像を含むダブルカラムPDFファイルがあります。に基づいて提案されたソリューションを試しましたpdfimagesが、残念ながら、画像が返されませんでした。その後、Inkscapeを使用しようとしましたが、生成されたSVG画像は歪んでいて、EPSとしてエクスポートすることもできませんでした。

私たちのために働いたソフトウェアはMasterPdfEditorでした。

手順はこちら

マスターPDFエディターを使用してファイルを開きます
編集ツール（Alt + 1）を使用して、抽出する必要がある画像を選択します
図をコピー（Ctrl + C）
画像の周囲の破線のフレームをクリックし、右側のサイドバー（オブジェクトインスペクター）をチェックして、「Geomerty」をクリックします。そこにあなたの選択のサイズを見ることができます
新しいファイルを作成します（Ctrl + N）。ページサイズを指定するよう求められます。画像の正確なサイズを指定して、新しいファイルを作成します
今では少しトリッキーです：画像を貼り付けます（Ctrl + V）。新しいファイルに画像が表示されない場合があります。矢印を使用して、トレースできるまで移動します。
矢印を使用して、新しいページの中央に画像を配置します
PDFとして保存

結果は非常に高品質ですが、ソフトウェアは無料ではありません。「すべての機能を試すことができます」が、「出力ファイルに透かしを追加する」デモバージョンがあります。率直に言って、私は作成されたPDFに透かしに気付きませんでした。

— パンテリス・ソパサキス
ソース

これはAsk Ubuntuです...私たちはここでオープンソースが好きで、あなたのソリューションはクローズドソースの商用ソリューションです...これは、すでに支持されている答えよりもどうですか？（平均-1）

— -Fabby

3

@Fabbyフィードバックありがとうございます。私はそれを知りませんでした。askubuntu.comにそのようなルールはありますか？ただし、Ubuntuソフトウェアセンターを開くとすぐに、非フリーアプリケーションの提案が表示されます。

— パンテリスソパサキス16

いいえ、「ルール」はありません。そのため、この回答を削除する投票をしませんでしたが、無料の優れたツール（無料のビールや言論の自由など）があるので、それは単なる意見です。

— ファビー

1

+1。ImageMagickコマンドラインを使用しましたが、これはGUIを探している人にとって興味深いソリューションです。

— rpmcruz

2

それは一部の人々のために働く、それは十分に良いです。ナチスにならないでください。「私たち」が誰なのかわかりません。あなただけのために話すことができます。+1の答え

— sdaffa23fdsf

4

pdfmodを試すこともできます。画像を抽出し、他の基本的なpdf操作を行うことができるGUI（グラフィカルインターフェイス）です。

— やること
ソース

うーん、私には少しバグが多いようです。主に紫色の画像を含むPDFを挿入し、緑色がかった画像を取得しました。

— DBX12

2

必要なのがpdf / eps形式のトリミングされた画像である場合は、pdfmod（To Doで提案されているように）を使用して画像を含むページを抽出します。

次に、使用しpdfcropてそれを適切にトリミングし、試行錯誤によってマージンを設定します。

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf

— マシエスク
ソース

1

私はpdfimagesを使用していますが、これはコマンドラインツールであり、私には最適です。非常に使いやすく、--helpオプションを使用して、その使用法について詳しく知ることができます。私はUbuntuを使用しており、プリインストールされています。PDFファイルが暗号化されているかパスワードで保護されている場合、そのためのオプションがあるため、このツールは非常に効果的です。あなたは読むことができ 、より pdfimagesについてはこちら

— jetbird13
ソース

4

他の回答を読んでから投稿してください。これをカバーする他のものがあることに注意してください。

— エドウィン

OK、申し訳ありません:)パスワードで保護されたpdfファイルに関する情報があり、このツールにはこのオプションがあることを説明し、このツールに関するチュートリアルであるリンクを投稿したので、私は投稿したいと思いました。

— jetbird13

十分な評判を得た場合、他の回答にコメントしたり、賛成したりできます。

— エドウィン

1

pdfimagesでは、抽出された画像は2つ以上の部分に分かれている場合があります。抽出されたフォーマットを気にせずに再びそれらをまとめる簡単な方法は、パーツをLibreOffice Drawにインポートし、画像の切り取りダイアログで切り取り、パーツを配置し、ページサイズを調整し、好きな形式でエクスポートすることです。

— DafyddG
ソース

1

pdfviewerを使用してPDFから画像をトリミングする場合は、okularを試すことができます。あらゆる形式（テキストまたは画像）をpngまたはjpeg形式でトリミングできます。PDFからpng形式の画像を抽出する場合は、pdftohtmlを使用して最小限のコマンドで実行できます。pdfをhtmlと画像に変換します。-ここでは、例を見つけることができますhttps://www.youtube.com/watch?v=CG1rf7k3xo8を。PDFから多くの画像を抽出する場合は、これを試してみることをお勧めします。

— user203413
ソース

0

使用ソフトウェア：Xreader OS：Antergos

手順：

PDFを開く
画像を右クリック
[名前を付けて画像を保存]を選択します。
入力ファイル名と拡張子。
セーブ。

— ヤシュ・クリシャン
ソース

PDFから埋め込み画像を抽出する

つかいます pdfimages

つかいます `pdfimages`