PDFファイルから透かしを削除する方法


41

これは簡単な作業だと思いましたが、逆の結果になりました。

透かしは、すべてのページでまったく同じ(重複するが透明な)画像です。PDFCreator 0.9.8を使用して自分でPDFファイルを作成しました(著作権の心配はありません)。

友人のAdobe Acrobat Proを試してみましたが、うまくいきませんでした。削除しようとしますが、削除できません。ヘッダー/フッターなどを削除しようとしましたが、透かしは消えません。

透かしを削除するにはどうすればよいですか?


2
PDFは、電子印刷ページのような出力形式です。編集することを意図したものではありません。ほとんどの場合、ページを画像にエクスポートしたり、透かしを切り取って写真を撮ったりすること以外に、求めていることを行うことはできません。
mk12

ショッピングの推奨事項は、すべてのスタック交換Webサイトでトピック外です。この質問が
終わら

3
PDFCreator 0.9.8を使用し、各ページに透かしが追加されないようにオプションを設定するだけのようです。この質問は、元のソースがないためだと思います。
ラムハウンド

回答:


73

画像ベースの透かしには、自動削除を約束するいくつかのツールがあります。例えば:

これらはすべて無料で試用できますが、実際に目的の出力を生成するにはライセンスが必要です。

ただし、この特定のPDFファイルの透かし(OPからメールで送られてきた)は、すべてのページで繰り返される単一の画像ではありません。結局のところ、PDFCreatorはそれを(ほとんどピクセルごとに)それらのすべてにハードコーディングしました。これにより、透かしを削除するのがはるかに困難になります(そして、かなり肥大化したPDFファイルになります)。

透かしは実際には多くの小さな画像で構成されているため、PDFエディター(Foxit Advanced PDF Editorなど)でそれらを選択し、を押すだけで削除できますDelete。残念ながら、すべてのページでこれを繰り返す必要があります。

時間のかからない解決策は、透かしをプログラムで削除することです。必要なもの:

手順

  1. Pdftkをダウンロードして、pdftk.exeおよびlibiconv2.dll%windir%\ System32に抽出します。これは、パス内のディレクトリまたは任意のその他の場所です。

  2. Notepad ++をダウンロードしてインストールします。

  3. PDFストリームは通常、DEFLATEアルゴリズムを使用して圧縮されます。これはスペースを節約しますが、PDFのソースを判読不能にします。

    コマンド

    pdftk original.pdf output uncompressed.pdf uncompress
    

    すべてのストリームを圧縮解除するため、テキストエディターで変更できます。

  4. オープンuncompressed.pdf透かしの構造を明らかにするために、メモ帳++で。

    この特定のケースでは、すべてのページはブロックで始まります

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    このブロックと同じように、ほぼ4,000ブロックあります。この特定のブロック/W 1 /H 1は、透かしのピクセルの1つ()のみを設定します。

    パターンが変化するまで下にスクロールすると、透かしのストリームの長さが95,906バイトであることがわかります(改行をカウント)。PDFファイルのすべてのページでまったく同じストリームが繰り返されます。

  5. Ctrl+ Hを押して、以下を設定します。

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    正規表現q 9 0 0 9 2997 4118\.67 cm.{95881}は、上記のブロックの最初の行(q 9 0 0 9 2997 4118.67 cm)とそれに続くすべての95,881文字、つまり透かしのストリームに一致します。

    [ すべて置換 ]をクリックすると、PDFファイルのすべてのページから削除されます。

  6. 透かしは削除されましたが、PDFファイルにエラーがあり(ストリームの長さが正しくありません)、圧縮されていません。

    コマンド

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    両方を処理します。

  7. uncompressed.pdfは不要になりました。削除できます。

結果は、透かしのない同じPDF(および約半分のサイズ)です。


4
私が便利だと思った別のトリック:PDFの透かしに対応するブロックを見つけるのは困難でした。したがって、私がしたことは、PDFから単一のページを抽出することでした。理想的には、透かしだけがあり、それ以外のページはありません。この1ページだけで、ウォーターマークに対応するブロックを見つけやすくなります。その後、戻って元のPDFに対して実行します。
ケニーLJ

1
うわー、これは私がこれを管理するための良い方法を見つけたインターネット上の最初の場所です。コンテナ形式で読むことをお勧めする場所はありますか?
コンスタンティン

2
@hobs IIRC、公式のPDFリファレンスの一部を読んでこの回答を書きました。
デニス

1
@Dennisに感謝します。すでに賛成票を差し上げましたが、これが最高の標準的なソースのようです。いくつかの検索/置換と、いくつかの追加の圧縮試行とエラーの実行により、必要なことを行うことができました。巨大な助け!
コンスタンティン

7
代わりに 、pdfファイルを圧縮解除および圧縮pdftkすることもできqpdfます。コマンド:qpdf --stream-data=uncompress original.pdf uncompressed.pdfおよびqpdf --stream-data=compress uncompressed.pdf nowatermark.pdf
David Schuler

6

透かしは、実際には.PDF内の画像の一部であり、.PDFの表示に使用しているものによってレンダリングされる別個の画像ではないようです。.PDFから画像を抽出し、それらを画像エディターで実行してから手動で.PDFを再構築しないと、透かしを削除できない場合があります。


4

テキストの透かしの場合、PostScriptバージョンの編集がはるかに簡単になります。

$ pdftops document.pdf

document.psを編集し、次にPDFに変換して戻します

$ ps2pdf document.ps


Linuxでは、以下のことを注意してくださいpdftopspdf2ps異なっています。2番目ではなく、最初のコマンドを使用します。
カミーユ・グドゥスヌ

1
透かしテキストが何であるかを知っているなら、ここにワンライナーがあります。pdftops in.pdf - | sed 's/WATERMARK//' | ps2pdf - out.pdf
カミーユ・グドゥスヌ

1

スタンプのアーティファクトは、Adobe Acrobat Pro内でスタンプを削除できることですが、ストリームオブジェクトはスタンプを永続的に保持するため、マウスの移動で再生成されます。

pdfソースを編集しようとすると、トリッキーになりますが、ファイルが破損する可能性があります。

スタンプがストリームの場合は、コンピューターをネットから切断することで中断できます。

次に、Adobe Acrobat Proを使用して、注釈の1つを選択し、右クリックしてポップアップを表示し、「コメントリストの表示」を選択しました。

リストから邪悪な透かし/スタンプを選択し、右クリックしてポップアップを取得し、「削除」を選択します。添付が発生するすべてのページでこれを行います。

別の名前でファイルを保存します。アプリケーションがクラッシュしましたが、ファイルを保存する前ではありません!

新しいはるかに小さいファイルを開きます。すべての透かし/スタンプがハメ撮りであることに注意してください。

私の場合、3ページのドキュメントのファイルサイズは300 kbから60 kbまで縮小しました。元のデータと注釈はすべてそのまま残りました-透かしなし。

〜グッドハンティング:o)


1

zamzarを使用してドキュメントを.rtfファイルに変換します。ウォーターマークは、変換後に自動的に消えます。 注: -文書にテキスト素材が含まれている場合、完全に機能します。これは常に大きな助けになりました。(Macユーザー)


これは、試したPDFでは機能しません。
ケニーLJ

1

別の方法を見つけました:

  1. 使用pdf2htmlEXの HTMLファイルにPDFに変換するツール(またはHTMLへの変換、他のPDFファイル)。
  2. テキストエディターでHTMLを編集し、透かしを削除します。それを保存。
  3. 新しいPDFドキュメントへのHTMLへの印刷
  4. 利益

ありがとうございました。この方法でAdobe Acrobatで透かしを削除できなかったと確信していますか?(これは確かに安価なソリューションかもしれません。)
Apache

Adobe Reader内の透かしを削除するには、何らかの種類のパスワードが必要だと思うので、この方法を使用しました。
ドミニクアンタル

0

これは、2012年7月30日18:06の@Dennisの回答の補足です。

透かしが単純な装飾されていないテキストである最も単純な場合、たとえば

スメドレーフォーコミッショナー

非圧縮PDF透かしは、次のように定義できます。

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

ここで、75.96水平方向のオフセットされ、625この特定の透かしのインスタンスのオフセット垂直。(はい、実数と整数の両方が表示される場合があります。)

次のような正規表現は、そのようなすべての透かしに対して機能し、配置のバリエーションを無視します。

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

また、さまざまな修正PDF演算子が、より複雑な書式設定を持つ透かしを使用する場合があることに注意してください。このような空想は、読者が期待しているもの(希望?)を、連続した、簡単に検索できる文字列に変えて、大量のアルファベットスープに変えることができます。例えば、

E 1 = Smedley™によるmc²

これの製品かもしれません:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

。。。または、ウォーターマークがカラー強化されている場合はさらに悪化します!

このすべてに留意したうえで、PDFtkには、4ドルのライセンス料を考慮して、透かしを処理することを意図したGUIバージョンがあることに注意します。まったく高価ではありません!

一方、私はそのウェブサイトが現在、Windows 8とを通じてO / Sの完全なサポートをアドバタイズしていることを発見しましたOS X 10.8 Mountain Lion。そのヴィンテージは4年以上前です。PDFtkが古くなっている可能性がありますか?私は疑わないが、知らない。


PDFtkの勧告をありがとう、きちんと見えるが、ええ、少し臭いもあります。無料版は2.02で、ウィキペディアによると3年前に実際にリリースされました。en.wikipedia.org
Apache

1
@Shiki-実際、私はPDF形式についていくつかの真剣な研究を行いましたが、過去10年間のPDFの進捗状況についての詳細な評価を破棄しました。 概要は次のとおりです。「PDF仕様の開発に照らし た3年前のPDFtkリリースの落とし穴」2005年以降、いくつかの更新がありましたが、_PDFtk_で大丈夫でしょう。_ これは、一般的に利用可能な最新のPDFドキュメントソースを確認した後に言います。私がチェックしたすべてのPDFドキュメントは、2010年以前の PDF標準(実際にはかなり前)で作成されました。疑問がある場合は、問題のPDFファイルの上位数十バイトをチェックしてください。
デアシュリー

0

ここにある無料と有料の方法私はあなたがGoogleドライブを使用することをお勧め、それを行うには。

Googleドライブには、ファイルを開いて若干の編集を行う機能があります。また、オンラインでPDFから透かしを削除するために使用できます。

  1. Googleドライブアカウントを開きます。これは基本的にGmailアカウントと同じです。
  2. [新規]> [ファイルのアップロード]をクリックし、PDFドキュメントを選択してアップロードします。
  3. 完了したら、ドライブにアップロードされたファイルを確認し、右クリックして「Googleドキュメント」で開きます。
  4. その後、透かしは自動的に削除されます。保存するには、「ファイル」に移動して「ダウンロード」をクリックし、「PDFドキュメント」を選択します。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.