タグ付けされた質問 「tesseract」

13
tesseract OCRの精度を向上させる画像処理
私は文書をテキストに変換するためにtesseractを使用しています。ドキュメントの品質は非常に幅が広​​いので、どのような画像処理で結果が改善されるかについてのヒントを探しています。ピクセル化されたテキスト(FAXマシンによって生成されたテキストなど)は、テッセラクトの処理が特に困難であることに気づきました。おそらく、文字のギザギザのエッジすべてが形状認識アルゴリズムを混乱させます。 どんな種類の画像処理技術が精度を向上させるでしょうか?私はピクセル化された画像を滑らかにするためにガウスぼかしを使用していて、いくつかの小さな改善を見てきましたが、より良い結果をもたらすより具体的な手法があることを期待しています。白黒の画像に合わせて調整されたフィルターを言います。これにより、不規則なエッジが滑らかになり、その後にコントラストを高めて文字をよりはっきりさせるフィルターが続きます。 画像処理の初心者のための一般的なヒントはありますか?

4
TesseractとOpenCVのどちらを選択するのですか?[閉まっている]
休業。この質問は意見に基づいています。現在、回答を受け付けていません。 この質問を改善してみませんか?この投稿を編集して質問を更新し、事実と引用で回答できるようにします。 昨年休業。 この質問を改善する 最近、TesseractとOpenCVに出会いました。Tesseractは本格的なOCRエンジンであり、OpenCVをOCRアプリケーション/サービスを作成するためのフレームワークとして使用できるようです。 一部の画像でTesseractを使用してみましたが、その精度はまともです。後で、OpenCVを使用してPythonを使用してOCRを実行する方法に関する非常に簡単なチュートリアルに出会い、感銘を受けました。数分で、システムのトレーニングが終了し、その精度は良好でした。しかし、もちろん、このアプローチを取るには、大規模なトレーニングセットを使用してシステムを広範囲にトレーニングする必要があることを意味します。 私の具体的な質問は次のとおりです。 TesseractとOpenCVを使用してカスタムOCRアプリを作成する方法をどのように選択しますか? Tesseractで使用できるさまざまな言語のトレーニングデータセットがあります。OpenCVにも同様のものがあるので、OCRを達成するために最初からやり直す必要はありませんか? 商用アプリケーションになりたい方はどちらが良いですか? 助言がありますか?

11
Tesseract実行エラー
Linuxでtesseract-ocrエンジンを実行する際に問題が発生しました。RUS言語データをダウンロードして、tessdataディレクトリ(/ usr / local / share / tessdata)に配置しました。コマンドtesseract blob.jpg out -l rusを使用してtesseractを実行しようとすると、エラーが表示されます。 Error opening data file /usr/local/share/tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language eng Tesseract couldn't load any languages! Could not initialize tesseract. コンパイルガイドによると、私export TESSDATA_PREFIX='/usr/local/share/' はtessdataディレクトリをポイントしていました。多分私は設定ファイルを編集する必要がありますか?Tesseractは、「ru​​s」ではなく「eng」データファイルをロードしようとします。 …
82 ocr  tesseract 

3
CaptchaでのPython画像処理ノイズの除去方法
私は画像処理に非常に慣れていないので、キャプチャしようとしていることはキャプチャからノイズを取り除くことです。 キャプチャについては、さまざまなタイプがあります。 最初のものは私がやったことです: まず、黒でないピクセルをすべて黒に変換しました。次に、画像からノイズのパターンを見つけて削除しました。最初のキャプチャについては、それをクリアするのは簡単で、テキストをテッセラクトで見つけました。 しかし、私は2番目と3番目の解決策を探しています。 これはどのようにする必要がありますか?それをクリアするための可能な方法は何ですか? これは私がパターンを削除する方法です: def delete(searcher,h2,w2): h = h2 w = w2 search = searcher search = search.convert("RGBA") herear = np.asarray(search) bigar = np.asarray(imgCropped) hereary, herearx = herear.shape[:2] bigary, bigarx = bigar.shape[:2] stopx = bigarx - herearx + 1 stopy = bigary - hereary + 1 pix …

2
小さなpdfファイルで巨大なBufferdImageが生成される
PDFでOCRを実行しようとしています。コードには2つのステップがあります。 PDFをTIFFファイルに変換 TIFFをテキストに変換する 最初のステップでghost4jを使用し、次に2番目のステップでtess4jを使用しました。マルチスレッドで実行を開始するまではすべてうまくいき、その後奇妙な例外が発生しました。私はここを読みました:https : //sourceforge.net/p/tess4j/discussion/1202293/thread/44cc65c5/そのghost4jはマルチスレッドに適していないので、PDFBoxで動作するように最初のステップを変更しました。 だから今私のコードは次のようになります: PDDocument doc = PDDocument.load(this.bytes); PDFRenderer pdfRenderer = new PDFRenderer(doc); BufferedImage bufferedImage = pdfRenderer.renderImageWithDPI(0, 300); ByteArrayOutputStream os = new ByteArrayOutputStream(); ImageIO.write(bufferedImage, "tiff", os); os.flush(); os.close(); bufferedImage.flush(); 800 kbのpdfファイルを使用してこのコードを実行しようとしています。 BufferedImage bufferedImage = pdfRenderer.renderImageWithDPI(0, 300); 500 MBを超えます。このBufferedImageをディスクに保存すると、出力は1 MBのサイズになります...したがって、このコードを8つのスレッドで実行しようとすると、Javaヒープサイズの例外も発生します... ここで何が欠けていますか?1 MBのファイルが500 MBの画像ファイルになるのはなぜですか?DPIで遊んで品質を下げようとしましたが、ファイルはまだ非常に大きいです... PDFをtiffにレンダリングできる他のライブラリはありますか?メモリの問題なしに10スレッドを実行できますか? 再現する手順: Linkedin CEOの履歴書ファイルをこちらからダウンロードしてください-https://gofile.io/?c= TtA7XQ …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.