PDFからOCRを削除する方法は?


13

しばらくGoogleを検索していましたが、質問の答えが見つかりません。

Adobe Acrobatで最近スキャンしたドキュメントにOCRの不要なレイヤーがあります。OCRedが正しくないため、一部の情報を編集したいのですが、OCRは必要な情報を消去するために作成しています。ファイルをTIFに変換しましたが、(非常に)重大な品質の低下に気付きました。別のPDFに印刷すると、テキストが保持されるか、画質が低下するという話を聞きました。

この問題をできるだけ早く解決するための助けに感謝します。

ありがとうございました。

回答:


5

Acrobat Pro DCでは、適切なコマンドは「隠し情報の削除」で、「保護」ツールと「編集」ツールの両方から使用できます。

コマンドを実行すると、非表示の情報が検索されるだけで、ドキュメントは変更されません。次に、削除する情報をAcrobatに伝える必要があります。この場合、[結果]ペインで[非表示テキスト]を選択し、[削除]ボタンをクリックして、変更したドキュメントを保存します。


「隠された情報を削除」を使用しましたが、何らかの理由で特定のページの画像の一部を削除するだけです。ただし、返信いただきありがとうございます。
-Sanoo

これは普遍的に真実ではありません。どういうわけか(おそらくmacOS PDFKitのバグ)ABBYY FineReader-OCRedテキストが破損し、[編集]→[非表示の削除]で[非表示のテキスト]をチェックしても問題なくテキストが削除されました。その後、[スキャンの強化]→[テキストの認識]を使用して、Acrobat内でOCRを正常に実行できました。
ニコラスライリー

私にとっての問題は、非表示のテキストを削除した後でも、「ClearScan」(つまり「編集可能なテキストと画像」)でOCRを実行できないことです。テキストレイヤーがなくなったように見えても、OCRを実行すると「Acrobatは認識を実行できませんでした:ページにレンダリング可能なテキストが含まれています」というエラーが生成されるため、奇妙です。
user1125483

1

多くの実験の後、Adobe AcrobatからAdobe PDFに印刷すると、OCRなしで品質を損なうことなくドキュメントが印刷されることがわかりました(一目でわかる解像度は失われます)。

しかし、多くのサイトはこれが機能しないと主張しています。Foxit ReaderやOneNoteなどの他のプリンターも試しましたが、品質は低下しました。JPEGも同じでした。

マイレージは異なる場合があることに注意してください。

注:私のスレッドよりも良い答えを見つけることを期待して、このスレッドを未回答としてマークしておきます。


1

(1年前...)

あなたが言うように、文書がスキャンされ、たとえばWordからPDFに印刷されない場合、Adobeで簡単に削除できます。

[ ドキュメント]、[ドキュメントの検査]を選択すると、非表示のテキスト(OCR)を削除できます。


お返事をありがとうございます。できるだけ早くテストして、お知らせします。答えてくれてありがとう!
-Sanoo

私はすでにこれについてコメントしていると思ったが、問題はAcrobat DC Proを持っていることであり、それらのメニューは削除された。とにかく答えてくれてありがとう。
-Sanoo

1

Acrobat Proの場合:「隠された情報を削除する」(「保護」の下)を使用します。すべて選択して実行し、OCRを削除します


1

Acrobat Xの[保護]の下にある[ドキュメントのサニタイズ]ボタンを使用して、表示できるもの(OCRされたテキストレイヤーを含む)をすべて削除し、ドキュメントをフラットビットマップに変換します。


0

この無料のPDF Redactorを実行するツールを作成しました。画像をアップロードして[編集]をクリックすると、pdfがフラット化され、OCRが削除されます。必要に応じて、ドキュメントに墨消しマークも描画できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.