私の問題は、640ページのPDFファイルから画像を抽出することです。
その大半は、テキスト付きのチャートと表です。単純なコピーと貼り付けを行うと、画像の解像度が失われ、テキストがぼやけて読みにくくなることがあります。
解像度に影響を与えずにPDFファイルから画像を抽出するより良い方法を知っていますか?
私の問題は、640ページのPDFファイルから画像を抽出することです。
その大半は、テキスト付きのチャートと表です。単純なコピーと貼り付けを行うと、画像の解像度が失われ、テキストがぼやけて読みにくくなることがあります。
解像度に影響を与えずにPDFファイルから画像を抽出するより良い方法を知っていますか?
回答:
XPDFスイート(無料&オープンソースソフトウェア)pdfimages.exe
からCLIツールを使用して、PDFからすべての画像を抽出するか、ページの範囲からすべての画像を抽出できます。33-36ページからすべての画像を抽出する例を次に示します。
pdfimages.exe ^
-f 33 ^
-l 36 ^
-j ^
c:/path/to/input.pdf ^
c:/path/to/directory/input_images
は、-j
埋め込まれたJPEG画像をJPEGとして抽出しようとします。他のすべての画像は、PPM(ポータブルpixmap)として出力されます。注意、PPMは完全に非圧縮です!
./pdfimages -j PDF_to_be_extracted.pdf /Users/username/output_folder/
これはevince
、Ubuntuで(ドキュメントビューアー)を使用すると非常に簡単です。evince
ウィンドウを使用してPDFを開き、ウィンドウの最大化を解除して、マークを付けてからAlways on top
、好きなフォルダーに画像をドラッグアンドドロップします。
元の解像度の画像の抽出はSolid Framework SDKの無料機能の1つであるため、C#でソリューションを作成する場合、これはhttp://www.soliddocuments.com/features.htm?product=SolidFrameworkです 。
この機能を示すサンプルアプリケーションは、GUIバッチソリューションが必要な場合も無料です:http : //www.pdf-internals.com/download.htm?product=SolidPDFMechanic
(ソリッドドキュメントを使用しています)
(1)Word 2013でファイルを開くことができ(ファイル-開くだけを使用)、画像をコピーできます。解像度は印刷には十分ですが、オリジナルと同じかどうかはわかりません。
(2)フリーウェアビューアーSumatraPDF(LaTeXを使用する場合に非常に良い)には、画像を右クリックしたときに[画像をコピー]メニューオプションがあります。私はそれが解像度を保持していると思います(画像をコピーできなかったファイルを見ましたが)。
(3)[ファイル]の下にある[ Adobe Acrobat X]には[他の名前で保存-イメージ]があり、デフォルトでは高解像度が使用されます(試した場合は元の解像度でした)。
(4)Perlには、複数の方法があります。たとえば、ここから読んで、あらゆるものからJPEG画像を抽出するプログラムに特に言及しました。
PHOTOSHOP!PhotoshopでPDFを開きます。(Windows 7でPhotoshop CCを使用)
いいえ-コピーアンドペーストは埋め込みリソースの元の解像度を保持する必要があります-最も可能性が高いのは、PDF内で縮小された低解像度の画像であるため、エクスポートすると、見た目よりも悪く見えることです。
縮小するか、PDFと同じサイズにするか、実際に同じサイズにしてください。
または、(最悪のオプション)100%ズームに移動してスクリーンショットを撮るか、Windows Vista / Windows 7のスニッピングツールを使用します。
注.PDF
-sの画像は、通常.PDF
、に変換されるときに縮小/圧縮されますが、一度圧縮されると、と同じ品質で抽出できるようになりますPDF
。
どのPDF表示ソフトウェアを使用していますか?
Adobe Acrobat ProのようなPDF 編集/作成プログラムを使用することにより、PDFファイルにある埋め込み画像を抽出できるようになります*。Adobeサイト(WindowsおよびMac用)から無料の試用版を入手できます。これは、目的のためだけに使用できます。
*それらが保護されていない限り、その場合はあなたがする必要があります..えー、私はそこに行きません...
Imagemagickを使用して、すべてのPDFページを個別の画像ファイルに変換し(このような大きなドキュメントを作成するのにどれだけの時間がかかるか、または対応できるかどうかはわかりませんが!)、必要なものを切り取ります。少なくとも、埋め込み画像の解像度が必要なもので問題ないかどうかがわかるので、これを試してみる価値があります。
Acrobat Proを使用している場合、これは、高解像度のスナップショットを撮る最も簡単な方法です(必要な高さに設定します)。プリファレンス/一般で、「スナップショットツールに固定解像度を使用する」と書かれたボックスをチェックし、解像度を好みに合わせて設定します(300ppi以上など)。次に、スナップショット(ツール/選択&ズーム/スナップショットツール)を実行すると、高解像度コピーがクリップボードにコピーされます。次に、クリップボードから必要な場所に貼り付けます。よく働く。
詳細な説明を表示するには、このリンクをクリックしてください...
Adobe Acrobat Pro
[ファイル]> [名前を付けて保存 ]では、[編集]> [設定]の[ PDFから変換 ]設定が使用されます。
[PDFから変換]は、各ファイル形式に対して[設定の編集...]を許可します
ベストは、PDFの作成に使用されたソース画像と解像度に依存します。
ただし、ロスレスTIFF設定を編集することで、かなり良い結果を得ることができます
解像度を1200以上に設定し(保存が失敗した場合は低く設定)、元の[ファイル]> [名前を付けて保存]を使用してPDFファイルを高解像度の個別ファイルにレンダリングします
最善の方法ではありませんが、異なるドキュメントタイプとしてレンダリングするよりもはるかに優れています。
ファイルは非常に大きくなりますが、カットアンドペーストに適しています
Adobe InDesignでは、「配置」コマンドを使用してPDFファイルをインポートできます。特定のページをインポートする場合は、「配置」コマンドをクリックした後に表示されるダイアログで「インポートオプションを表示」チェックボックスを有効にします。高解像度画像として必要なものがページに収まるように、フレームをドラッグしてサイズを変更します。多くの場合、画像の縦横比に応じてドキュメントのページサイズを変更する必要があります。表示に満足したら、[エクスポート]コマンドを使用して[高品質PDF]を選択します。これにより、ラテックスドキュメントで印刷または使用できる高解像度PDFが作成されます。