堅牢なOCR /スキャンソフトウェアの推奨事項


0

理想的には、スマートバッチ機能、画像補正と調整可能なOCRを重視したいと思います。ユースケースの例:教科書のページの写真があります-最も理想的なアプリケーションは、これまでシャドウとノイズを調整し、フィルターを適用してテキストを明確にし、テキストと画像を区別して個別に処理し、曲がったページを補正するためにスキューを調整し、正しくトリミングします、OCR調整用のツールを提供し、PDFにコンパイルします。間違っている場合は修正してください。ただし、これらのタスクはすべて、開発者の観点からそれほど難しくはありません。このソフトウェアがまだ存在しない場合、それを最も上手くやる人は何百万人にもなります!

回答:


1

Prizmoと呼ばれるすばらしいアプリで解決しました。いくつかの不可解なインターフェイスの問題(スライドが時々自分自身を再配置したり、サムネイルを隣接するページに変更したりします!?)が、教科書の低照度カメラ付き携帯電話の写真をフラットで曲率補正された読みやすいpdfに変換することができました。OCRはまったく動作しませんでしたが、画像の品質が非常に低かったため、動作した数回に驚きました。写真にもっと注意を払えば、iPhoneカメラで撮影したページを簡単に読むことができたでしょう。本当に素晴らしい曲率補正、わずかなインターフェース調整だけで、キーショートカットや曲率調整インターフェースに考えられたいくつかの考え、または同様のページに曲率補正設定をコピーする機能など、より多くのページに対してこのソフトウェアを完璧かつ効率的にします。または、本の写真/スキャンから2ページを引き出すある程度明白な機能。現在のUXリードを解雇し、テクノロジーユーザーに置き換えた場合、次のアップデートは絶対的なゴールドになります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.