優れたオープンソース(無料)手書きOCRプログラムはありますか?


16

タイトルはそれをすべて求めます。私の前にはあまり熱心ではないデータ入力タスクがあります:50-100ページの手書きサインアウト/サインインログ。

ログの形式が役立つ場合があります。ページは明確に区切られた行と列に分割されます(13r x 6cに追加のヘッダー行があります)。さらに役立つのは、3つの列が日付/時刻に関連していることです(日付、タイムアウト、入力)。また、2つの列(リソースと名前)のデータは多かれ少なかれ列挙されるので、たとえば、同じ手書き文字で名前列に「Smith」という名前が何度も​​現れることがあります。最後の列「Notes」は自由形式ですが、前の6列を自動化できれば、Notesを手入力することは気にしません。

助言がありますか?(「入力を開始する」以外に)

PSこれを尋ねるより良いSEサイトがあれば、私に知らせてください、私はそこで尋ねます。


1
ログのサンプルスキャンを投稿できますか?
マーティントンプソン

1
Captricityを気にしないでください-彼らはあなたのメールを求め、リンクなしでua「リンクメール」を送信します。

そして、これは«オープンソース»と«無料»という用語と混同されたときに起こることです...あなたは、«オープンソース»が«悪いと等しいという考えを与えて、市場で利益を得ようとしている会社を持っています»。
ジョアン

回答:


6

tesseractは、おそらく最も広く普及しているOCRライブラリです。

手書きでテストされており、それほど悪くはありません-手書きは読みやすいものではありませんが。http://arxiv.org/ftp/arxiv/papers/1003/1003.5893.pdf


Tesseractは、フリー/オープンソースを検討している場合には確かに良い選択肢です。100%ではありませんが、ほとんどの場合、かなり正確な結果が得られます。
ケンパチ船長

4

10ページ未満の場合、Captricityは無料でそれを行うことができます。

箱から出して、探しているものに対する優れたオープンソースソリューションはありません。有料ソリューションには、ライセンスが必要です。これはCaptricityで手書きOCRサービスを構築した経験に基づいています。生産ではテセラクトを使用しますが、人間の知能(クラウドソーシング)と組み合わせて高レベルの品質を提供する投票としてのみ使用します。

お役に立てば幸いです!

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.