pdftkを使用してpdfから透かしを削除する方法は?


33

パブリックドメインブックのすべてのページに広がるバカな電子メールの透かしをいくつか削除する必要があります。pdftkのマニュアルページといくつかの例を見てみましたが、それでも透かしを削除する方法がわかりません。あなたのヒントに感謝します。

回答:


35

実行する非常に単純なタスク:

sedを使用します。

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf

しかし、その後、結果の出力pdfを必ず修復してください

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

すべてを1つのコマンドに:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

テキストの透かしは、pdf圧縮コード内の2つのタグ間のテキストにすぎません


1
素晴らしい!魅力のように働いた。メールアドレスの名前を架空の名前に変更してください。この本をどれほどだめにしたかを、スパマーの標的にしたくありません。特に彼はおそらくpdfを作成した人だからです。どうもありがとう。
hnns

できた!特定の文字列を一般的な文字列に変更

リンクの透かしを取り除くためにこのソリューションを変更する方法を知っている人はいますか?テキストを削除しましたが、テキストがあった場所にはまだ小さな正方形が残っています。
425nesp

これを実行すると、pdftkがクラッシュしました。
セリン

@Dingoはどのようにバッチ処理しますか?私は複数のファイルを意味する
Clain Dsilva

49

私にとってはうまくいかなかったので、Dingoの答えへのほんの少しのアドオン:

透かしを見つけてに置き換えるために、最初にPDFドキュメントを解凍する必要がありましたsed。最初のステップでは、次を使用してPDFドキュメントを解凍しますpdftk

pdftk original.pdf output uncompressed.pdf uncompress 

今、uncompressed.pdfDingoの答えのように使用することができます:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf

その後、ドキュメントを修復して再圧縮しました。

pdftk unwatermarked.pdf output fixed.pdf compress

あなたは命の恩人です!ありがとうございました!!!:)
ジョンドド

1
これは本当に素晴らしいです!
14年

4
私はこのプロセスを採用し、少し手の込んだものにして、Pythonスクリプトにまとめました。こちらはgithubにあります
アレクサンダーガーデン14

@Alexander Garden TypeError: str() takes at most 1 argument (2 given)与えられた使用上のアドバイスに従って使用すると動作しません
8bitjunkie

2
マスターPDFエディターで追加された透かしを削除できませんでした。
fccoelho

-2

www.it-ebooks.infoを削除するには、

notepad ++またはtextpadでPDFを開きます

www.it-ebooks.infoを何もない(空白)に置き換えます

ファイルを保存する

標準のAdobe Readerで開く

終了すると、ファイルを保存するように求められます

それを保存


1
これは一般的な解決策ですか?www.it-ebooks.infoとは何ですか?
カルロ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.