タグ付けされた質問 「ocr」

3
OpenCV-Pythonのシンプルな数字認識OCR
OpenCV-Python(cv2)で「数字認識OCR」を実装しようとしています。それは単に学習目的のためです。OpenCVのKNearest機能とSVM機能の両方について学びたいと思います。 各桁のサンプル(画像)が100個あります。一緒にトレーニングしたいです。 letter_recog.pyOpenCVサンプルに付属するサンプルがあります。しかし、それをどうやって使うのかまだ分かりませんでした。サンプルやレスポンスなどがわかりません。また、最初はtxtファイルが読み込まれましたが、最初はわかりませんでした。 後で少し検索すると、cppサンプルにletter_recognition.dataが見つかりました。私はそれを使用し、letter_recog.pyのモデルでcv2.KNearestのコードを作成しました(テスト用のみ): import numpy as np import cv2 fn = 'letter-recognition.data' a = np.loadtxt(fn, np.float32, delimiter=',', converters={ 0 : lambda ch : ord(ch)-ord('A') }) samples, responses = a[:,1:], a[:,0] model = cv2.KNearest() retval = model.train(samples,responses) retval, results, neigh_resp, dists = model.find_nearest(samples, k = 10) print results.ravel() それは私にサイズ20000の配列を与えました、私はそれが何であるかわかりません。 質問: …

14
reCaptchaはクラック/ハッキング/ OCR /敗北/破壊されていますか?[閉まっている]
この質問が今後の訪問者を助けることはほとんどありません。それは小さな地理的領域、特定の瞬間、またはインターネットの世界中のオーディエンスには一般的に適用できない非常に狭い状況にのみ関連しています。この質問をより広く適用できるようにするには、ヘルプセンターにアクセスしてください。 7年前休業。 reCAPTCHAを打ち破るためにプログラミング手法が使用されましたか? 私は、特にreCAPTCHAが完全に自動化された人のいない方法によって時代遅れになっている証拠と潜在的なデモンストレーションを見ることに興味があります。 明確にするために、CAPCHA、ポルノを求める人、またはメカニカルタークの入力をチームが担当するかどうかに関係なく、人間を含むreCAPTCHAの不正行為ソリューションを探すのではなく、 また、動物の種類や背景フィールド、JavaScriptのトリックなど、reCAPTCHAに代わるものを探していません。

5
Java OCR実装[終了]
閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善してみませんか?Stack Overflowのトピックとなるように質問を更新します。 4年前休業。 この質問を改善する これは主に好奇心ですが、純粋なJavaでのOCR実装はありますか?これが純粋にJavaでどのように機能するか知りたいのですが、OCRは一般的に興味があります。そのため、私が完全に理解している言語でどのように実装されるかを知りたいです。当然、これには実装がオープンソースであることが必要ですが、少なくともその場合のパフォーマンスを確認できるので、私はプロプライエタリなソリューションにまだ興味があります。 (Aspriseのような)Javaで使用できるカップルを見たことがありますが、これらが純粋なJava実装であるとは思われません...何かありますか?
160 java  ocr 

6
Android用の無料のOCRライブラリはありますか?[閉まっている]
現在のところ、この質問は、Q&A形式には適していません。私たちは回答が事実、参考文献、専門知識によってサポートされることを期待しますが、この質問はおそらく議論、議論、投票、または拡張された議論を誘います。この質問が改善され、場合によっては再開できると思われる場合は、ヘルプセンターにアクセスしてください。 8年前に閉鎖。 Androidで動作するJava OCRを探していますが、Aspriseはプラットフォームに依存しないOCRではないようです。Androidアプリケーション開発に使用できるオープンソース/無料のJava OCRはありますか?
148 android  ocr 

13
tesseract OCRの精度を向上させる画像処理
私は文書をテキストに変換するためにtesseractを使用しています。ドキュメントの品質は非常に幅が広​​いので、どのような画像処理で結果が改善されるかについてのヒントを探しています。ピクセル化されたテキスト(FAXマシンによって生成されたテキストなど)は、テッセラクトの処理が特に困難であることに気づきました。おそらく、文字のギザギザのエッジすべてが形状認識アルゴリズムを混乱させます。 どんな種類の画像処理技術が精度を向上させるでしょうか?私はピクセル化された画像を滑らかにするためにガウスぼかしを使用していて、いくつかの小さな改善を見てきましたが、より良い結果をもたらすより具体的な手法があることを期待しています。白黒の画像に合わせて調整されたフィルターを言います。これにより、不規則なエッジが滑らかになり、その後にコントラストを高めて文字をよりはっきりさせるフィルターが続きます。 画像処理の初心者のための一般的なヒントはありますか?

4
TesseractとOpenCVのどちらを選択するのですか?[閉まっている]
休業。この質問は意見に基づいています。現在、回答を受け付けていません。 この質問を改善してみませんか?この投稿を編集して質問を更新し、事実と引用で回答できるようにします。 昨年休業。 この質問を改善する 最近、TesseractとOpenCVに出会いました。Tesseractは本格的なOCRエンジンであり、OpenCVをOCRアプリケーション/サービスを作成するためのフレームワークとして使用できるようです。 一部の画像でTesseractを使用してみましたが、その精度はまともです。後で、OpenCVを使用してPythonを使用してOCRを実行する方法に関する非常に簡単なチュートリアルに出会い、感銘を受けました。数分で、システムのトレーニングが終了し、その精度は良好でした。しかし、もちろん、このアプローチを取るには、大規模なトレーニングセットを使用してシステムを広範囲にトレーニングする必要があることを意味します。 私の具体的な質問は次のとおりです。 TesseractとOpenCVを使用してカスタムOCRアプリを作成する方法をどのように選択しますか? Tesseractで使用できるさまざまな言語のトレーニングデータセットがあります。OpenCVにも同様のものがあるので、OCRを達成するために最初からやり直す必要はありませんか? 商用アプリケーションになりたい方はどちらが良いですか? 助言がありますか?

11
Tesseract実行エラー
Linuxでtesseract-ocrエンジンを実行する際に問題が発生しました。RUS言語データをダウンロードして、tessdataディレクトリ(/ usr / local / share / tessdata)に配置しました。コマンドtesseract blob.jpg out -l rusを使用してtesseractを実行しようとすると、エラーが表示されます。 Error opening data file /usr/local/share/tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language eng Tesseract couldn't load any languages! Could not initialize tesseract. コンパイルガイドによると、私export TESSDATA_PREFIX='/usr/local/share/' はtessdataディレクトリをポイントしていました。多分私は設定ファイルを編集する必要がありますか?Tesseractは、「ru​​s」ではなく「eng」データファイルをロードしようとします。 …
82 ocr  tesseract 

1
OCRのクリーニング画像
OCRの画像をクリアしようとしています:(行) 時々画像をさらに処理するためにこれらの行を削除する必要があり、かなり近づきつつありますが、多くの場合、しきい値がテキストから取りすぎています。 copy = img.copy() blur = cv2.GaussianBlur(copy, (9,9), 0) thresh = cv2.adaptiveThreshold(blur,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV,11,30) kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9,9)) dilate = cv2.dilate(thresh, kernel, iterations=2) cnts = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) cnts = cnts[0] if len(cnts) == 2 else cnts[1] for c in cnts: area = cv2.contourArea(c) if area > 300: x,y,w,h = …

3
CaptchaでのPython画像処理ノイズの除去方法
私は画像処理に非常に慣れていないので、キャプチャしようとしていることはキャプチャからノイズを取り除くことです。 キャプチャについては、さまざまなタイプがあります。 最初のものは私がやったことです: まず、黒でないピクセルをすべて黒に変換しました。次に、画像からノイズのパターンを見つけて削除しました。最初のキャプチャについては、それをクリアするのは簡単で、テキストをテッセラクトで見つけました。 しかし、私は2番目と3番目の解決策を探しています。 これはどのようにする必要がありますか?それをクリアするための可能な方法は何ですか? これは私がパターンを削除する方法です: def delete(searcher,h2,w2): h = h2 w = w2 search = searcher search = search.convert("RGBA") herear = np.asarray(search) bigar = np.asarray(imgCropped) hereary, herearx = herear.shape[:2] bigary, bigarx = bigar.shape[:2] stopx = bigarx - herearx + 1 stopy = bigary - hereary + 1 pix …

2
小さなpdfファイルで巨大なBufferdImageが生成される
PDFでOCRを実行しようとしています。コードには2つのステップがあります。 PDFをTIFFファイルに変換 TIFFをテキストに変換する 最初のステップでghost4jを使用し、次に2番目のステップでtess4jを使用しました。マルチスレッドで実行を開始するまではすべてうまくいき、その後奇妙な例外が発生しました。私はここを読みました:https : //sourceforge.net/p/tess4j/discussion/1202293/thread/44cc65c5/そのghost4jはマルチスレッドに適していないので、PDFBoxで動作するように最初のステップを変更しました。 だから今私のコードは次のようになります: PDDocument doc = PDDocument.load(this.bytes); PDFRenderer pdfRenderer = new PDFRenderer(doc); BufferedImage bufferedImage = pdfRenderer.renderImageWithDPI(0, 300); ByteArrayOutputStream os = new ByteArrayOutputStream(); ImageIO.write(bufferedImage, "tiff", os); os.flush(); os.close(); bufferedImage.flush(); 800 kbのpdfファイルを使用してこのコードを実行しようとしています。 BufferedImage bufferedImage = pdfRenderer.renderImageWithDPI(0, 300); 500 MBを超えます。このBufferedImageをディスクに保存すると、出力は1 MBのサイズになります...したがって、このコードを8つのスレッドで実行しようとすると、Javaヒープサイズの例外も発生します... ここで何が欠けていますか?1 MBのファイルが500 MBの画像ファイルになるのはなぜですか?DPIで遊んで品質を下げようとしましたが、ファイルはまだ非常に大きいです... PDFをtiffにレンダリングできる他のライブラリはありますか?メモリの問題なしに10スレッドを実行できますか? 再現する手順: Linkedin CEOの履歴書ファイルをこちらからダウンロードしてください-https://gofile.io/?c= TtA7XQ …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.