画像からテキストを抽出するにはどうすればよいですか?


25

画像からテキストを抽出するにはどうすればよいですか?

スキャンされたファイルについてではなく、授業で黒板の高解像度写真を撮るときなど、庭のさまざまな画像で、きれいに手書きされています。または、レシピ帳からページを撮影し、テキスト形式のレシピが必要な場合。

そのための無料でオープンなソフトウェアはありますか?

tesseractを試してみましたが、結果はひどいものでした。


ベンガル語と英語を同時にサポートするOCRが必要です。
-alhelal

回答:


26

画像からテキストを抽出する行為が呼ばれOCR、UbuntuにはOCR専用のwikiページがあります。そのページから:

利用可能なOCRツール

Ubuntu Universeリポジトリには、次のOCRツールが含まれています。

  1. gocr-コマンドラインOCR
  2. fuzzyocr-画像の添付ファイルを確認するspamassassinプラグイン
  3. libhocr0-ヘブライ語OCR
  4. ocrad-光学式文字認識プログラム
  5. ocrfeeder-ドキュメントレイアウト分析および光学式文字認識システム
  6. ocropus-ドキュメント分析およびOCRシステム
  7. tesseract-ocr

Ubuntuマルチバースリポジトリには次のものも含まれます。

  1. cuneiform-多言語OCRシステム

一部のパッケージは古くなっていますが、Alex_P PPA(PPA追加コード:ppa:alex-p / notesalexp)に新しい非公式パッケージがあります。PPAを使用したことがない場合は、PPAからソフトウェアを追加する方法を確認してください。

編集:コメントに示されているように、Clara OCRも存在しますが、Hardyで苦労し、彼らのウェブサイトは2009年に最終更新されました。


私が説明した例でそれらのいずれかを使用した経験はありますか?私は彼らのために定期的なocrツールに少し懐疑的になりました。リストの7番は私が試したもので、明らかにひどいものでした。
ストラパコフスキー

思い出すと、gocrも試しましたが、同等のひどい結果になりました。これらのいずれかで成功した場合、どの構文を使用しましたか?ありがとう。
ストラパコフスキー

まったくありません!(); D Freshmeatの検索ショークララOCRとたTesseract OCR-:私は、OCRに煩わされませんfreshmeat.net/search/...
Rinzwind

OCRを正常に使用するには、プロセスの知識と、スキャンする特定の画像に合わせて慎重にセットアップする必要があると言うのは間違っていますか?したがって、私が正しい場合、悪い結果はソフトウェアではなくユーザーに起因する可能性があります。
NN

OCR画像の作成方法を知っていて、使用するソフトウェアの使用に精通している場合に最適に機能します(後者が私がそれを使用することを決して得なかった理由です)。
リンツウィンド

18

tesseract-ocr他のすべてに比べて素晴らしいものになります。インストールの場合は、コマンドを実行しsudo apt-get install tesseract-ocrます。

使用法はtesseract filename.jpg output.txtです。

上記のコマンドはを生成しoutput.txtます。

適切な言語を選択することを検討してください。その場合tesseract-ocr-LANG、パッケージをインストールする必要がありますLANG。3文字のISO 639-2言語コードです。現在、18.04リポジトリには123の言語があります。次に例を使用します。

tesseract mySpanishText.jpg output -l spa

ねえ、これは動作しますが、正確ではありませんか、私はむしろ80-85%の正確であると言いたいです。この画像の例のように:pbs.twimg.com/media/DJs6_pcXkAA2VrN.jpg、それは$記号とほとんどの括弧を台無しにしました。四角、丸、中、すべての括弧は問題であり、適切に抽出されることはありません。修正を知っていますか?
ミランチェダ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.