間違いを修正するためのGUIを備えた無料のOCRはありますか?(Windows用)


9

私はSimpleOCRを使用しました。これには、ミスを修正するための優れたGUIがあります。残念ながら、それは多くの間違いを犯します!(そして他のバグや制限に悩まされています)

一方、Tesseractはより正確ですが、GUIはまったくありません。

私の質問は、素晴らしいGUI 低いエラー率を持つWindows用の無料のOCRプログラムはありますか?SimpleOCRと同じようにOCRed単語を編集しているときに、疑わしい単語を強調表示し(スペルチェックだけでなくOCRの不確実性によって)、元の(ビットマップ)単語を表示します。

オープンソースが一番で、フリーウェア、トライアル/デモ/クリップルウェアが続きます。

エラーを修正するためのGUIを示すSimpleOCRスクリーンショット



2
@Sathya:私の特定の要件はその質問とは異なります。
ヒューアレン、

完全に無料ではありませんが、Microsoft Officeを調べましたか?OCRが付属しています。(セットアップで「Microsoft Office Document Imaging」機能を探してください。)
Vivelin

@horsedrowner:試したところです。その精度はTesseractに匹敵しますが、適切なDPI設定のTIFFファイルを必要とするか、機能しません。また、OCRの間違いを修正するためのインターフェースがありません。
ヒューアレン

@ヒューアレン:それはありますか?OneNote 2007でコンテキストメニュー機能を見つけたとき、それはかなりうまくいきました。そして、ウェブサイトからコピー貼り付けされたランダムな画像ファイルを使用していました...
Vivelin

回答:



2

OCRopus

ソフトウェアの一部は、現在利用可能な最高のオープンソースOCRエンジンであるTesseractに基づいています。このプロジェクトは来年末にリリースされ、Googleの書籍スキャンプロジェクトで使用される予定ですが、チームにはいくつかの興味深いアプリケーションが用意されています。

  • Webサービスインターフェース
  • PDF、カメラ、画面OCR
  • デスクトップ検索ツールとの統合:Beagle、Spotlight、Googleデスクトップ

OCRopus(tm)は、プラグイン可能なレイアウト分析、プラグイン可能な文字認識、統計自然言語モデリング、および多言語機能を備えた、最先端のドキュメント分析およびOCRシステムです。

OCRopusエンジンは2つの研究プロジェクトに基づいています。90年代半ばに開発され、米国国勢調査局によって展開された高性能手書き認識エンジンと、新しい高性能レイアウト分析手法です。

OCRopusは、Googleが開発を支援しており、当初は高スループット、大量のドキュメント変換作業を目的としています。また、他の多くのアプリケーションにとっても優れたOCRシステムになると期待しています。 代替テキスト リンク:


GOCR

GOCRは、GNU Public Licenseの下で開発されたOCR(光学式文字認識)プログラムです。スキャンしたテキストの画像をテキストファイルに変換します。Joerg Schulenburgがプログラムを開始し、現在は開発者チームを率いています。GOCRはさまざまなフロントエンドで使用できるため、さまざまなOSやアーキテクチャへの移植が非常に簡単です。多くの異なる画像フォーマットを開くことができ、その品質は日々向上しています。 代替テキスト 代替テキスト

リンク:



それらのいずれかがそれらと一緒に行くのにまともなGUIを持っていますか?
ヒューアレン

1
編集したあなたの質問に答えるん....が、私は言う:「いいえ、彼らはいけない」、私はAbiWordのサポートのOCRopus(聞くarstechnica.com/open-source/news/2007/08/...を
Krazy_Kaos

1
回答にスクリーンショットを追加したり、2つの提供されたプログラムをミニレビューしたりするための+1 ...
Kurt Pfeifle

0

TOPOCR(別名SnapReader)もあり、11言語用の後処理スペルチェッカーが含まれています。

SnapReaderを使用すると、ほぼすべてのドキュメントイメージから独自の検索可能なメモを作成できます。または、オーサリングツールとして使用し、スキャナーまたはカメラを使用して独自の編集可能なコンテンツを作成し、結果をHTMLまたはPDFとして保存できます。SnapReaderは、Audreyを使用してテキストを非常に高品質のオーディオに変換することもできます。スキャナーやカメラを使用してドキュメントをキャプチャできるだけでなく、ポータブルミュージックプレーヤーやスマートフォンを使用してドキュメントを「読み取る」こともできます。

画像

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.