コマンドラインを使用してPDFの画像を置き換える


11

一部のPDFファイルを処理する必要があります。タスクは、別の画像ファイルとの交換で構成されます。最初の問題は、バッチプロセスでコマンドラインからPDF画像を置き換える方法です。次に、置き換える必要のある画像を特定する方法など、他の問題に取り組みます(PDFファイルには複数の画像が含まれる場合があるため)。しかし、最初に最初の問題を解決したいと思います。PDF内の画像を別の画像に置き換える方法です。

私はpoppler-utilsとpdftkについて読みましたが、私の知る限り、これらのツールはどれも画像をPDFに置き換えることができません。


1
あなたが答えを見つけたら、それは知ることは本当に興味深いでしょう。「問題のページを」単離した後、あなたは別のものに画像を挿入して、PDFに戻って、それを変換するためのImageMagickを使用することができます。imagemagick.org/Usage/layers また:superuser.com/questions/614784/...
コンスタンティノス

@pidosaurusに感謝このオプションを検討していましたが、大きな問題があります。それは、PDF(または署名ページ)を画像に変換することを意味します。結果のPDFのサイズがはるかに大きくなり、ユーザーがコピーして貼り付けるテキストの一部を選択できないなどの問題が発生します。
Ivan

imagemagickからのルックアップ変換など、openofficeからooconvするツール(現在はlibreoffice)が提供しています-かつて、PPTからPDFへのコンバーターを作成するために誰かを雇ったことがあり、これらのツールが使用されていました。
数学

私が知っているPDFツールのどれもそれを行うことができませんが、その機能を備えたPDFライブラリを使用して新しいツールを書くことはそれほど難しくありません。解決しなければならない1つの問題は、PDFで特定の画像を指定する方法です。
dirkt

回答:


1

OK ... pdflatexここで欠けている部分だと思います。

OPは、彼は調査したpoppler-utilsと述べたpdftk。それに加えましょうpdfimages。これらは、一緒pdflatexになってソリューションの一部です。

pdfimages -f 4 -l 20 -j -png target.pdf imageroot

上記のコード例でpdfimages は、の4〜20ページを調べて、target.pdfすべての画像をで始まる名前のファイルに抽出しますimageroot

poppler-utils提供しますpdftotext。私-layoutはドキュメントを人間が読めるように保つ素晴らしい仕事をするオプションをお勧めします。

pdftotext -layout $1.pdf $1.txt

ピドサウルスimagemagick提供するソリューションに対するOPの反対は、画像に抽出可能なテキストがないことです。私が概説したユーティリティを使用すると、OPにはすべての画像と抽出されたすべてのテキストが含まれ、ページ番号とコンテンツはオプションによって保持されます。OPは、テキストの正しいページを識別し、ディレクティブで終わるファイルにチャックし、ファイル名で置換画像を参照することができます。次に、これで新しい単一ページの.pdfになり、を使用してドキュメントの残りの部分に挿入します。元のページのテキストのどこに画像が存在するかがわかっていれば、画像を正確な場所に配置できます。-layout.tex%includegraphicspdflatexpdftk%includegraphics [h]

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.