タグ付けされた質問 「ocr」

光学式文字認識(OCR)は、テキストの画像をワードプロセッサなどで操作できるテキストに変換するプロセスです。

1
端末でCuneiformを使用して画像ベースのpdfからテキストを抽出する方法
cuneiform -l eng -fテキスト-o outocr.txt input.pdf 上記のコマンドをターミナルで実行すると、私のPDFタイトルページのテキストのみがoutocr.txtファイルに出力されます。 120ページのPDFのすべてのテキストを認識させるにはどうすればいいですか。私はFedora Linux 25(x86_64)を使用しています。
linux  pdf  fedora  ocr 

1
画像後処理:紙なし
作ってみる 紙なし 動作するように、それはスキャンした本のページを後処理するための非常に強力なツールです。 Docを読みましたが、それでもWindowsでもLinuxでも動作させることはできません。 私の写真は、Gimpを使って.pbmフォーマットに変換したBitmapです(pgmとpnmも試しました)。それから私はこのコマンドを使います: unpaper -l double --pre-rotate -90 inputFile.pbm outputFile.pbm (-l doubleは1枚の用紙に2ページあり、 - pre-rotate -90はイメージを左に回転させる) これは次のようになります。 しかし、私の出力ファイルは入力との違いはなく、回転しただけです。
ocr 

3
写真から背景の白いページのテキストをキャプチャする
背景が白のページにtxtがある写真をtxtファイルに変換するつもりです。目的は、この画像のすべてのテキストをキャプチャすることです。 私はGoogleとimagemagickとこのツールを設立しました:SCAN Image to TEXT しかし、これが最良の選択肢ですか?写真のテキストをキャプチャすることは可能ですか?ありがとう
photos  ocr 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.