コンピュータユーザー ocr

1

cuneiform -l eng -fテキスト-o outocr.txt input.pdf 上記のコマンドをターミナルで実行すると、私のPDFタイトルページのテキストのみがoutocr.txtファイルに出力されます。 120ページのPDFのすべてのテキストを認識させるにはどうすればいいですか。私はFedora Linux 25（x86_64）を使用しています。

linux pdf fedora ocr

1

画像後処理：紙なし

作ってみる紙なし動作するように、それはスキャンした本のページを後処理するための非常に強力なツールです。 Docを読みましたが、それでもWindowsでもLinuxでも動作させることはできません。私の写真は、Gimpを使って.pbmフォーマットに変換したBitmapです（pgmとpnmも試しました）。それから私はこのコマンドを使います： unpaper -l double --pre-rotate -90 inputFile.pbm outputFile.pbm （-l doubleは1枚の用紙に2ページあり、 - pre-rotate -90はイメージを左に回転させる）これは次のようになります。しかし、私の出力ファイルは入力との違いはなく、回転しただけです。

ocr

3

写真から背景の白いページのテキストをキャプチャする

背景が白のページにtxtがある写真をtxtファイルに変換するつもりです。目的は、この画像のすべてのテキストをキャプチャすることです。私はGoogleとimagemagickとこのツールを設立しました：SCAN Image to TEXT しかし、これが最良の選択肢ですか？写真のテキストをキャプチャすることは可能ですか？ありがとう

photos ocr

タグ付けされた質問 「ocr」

タグ付けされた質問「ocr」