最近、TesseractとOpenCVに出会いました。Tesseractは本格的なOCRエンジンであり、OpenCVをOCRアプリケーション/サービスを作成するためのフレームワークとして使用できるようです。
一部の画像でTesseractを使用してみましたが、その精度はまともです。後で、OpenCVを使用してPythonを使用してOCRを実行する方法に関する非常に簡単なチュートリアルに出会い、感銘を受けました。数分で、システムのトレーニングが終了し、その精度は良好でした。しかし、もちろん、このアプローチを取るには、大規模なトレーニングセットを使用してシステムを広範囲にトレーニングする必要があることを意味します。
私の具体的な質問は次のとおりです。
- TesseractとOpenCVを使用してカスタムOCRアプリを作成する方法をどのように選択しますか?
- Tesseractで使用できるさまざまな言語のトレーニングデータセットがあります。OpenCVにも同様のものがあるので、OCRを達成するために最初からやり直す必要はありませんか?
- 商用アプリケーションになりたい方はどちらが良いですか?
助言がありますか?
OCR accuracy tests
いくつかのグラフが見つかります。また、モバイルアプリについては、ほとんどがtesseractを使用しています。しかし、それらのいくつかをダウンロードすることに迷惑をかけると、結果が約束とは少し異なることがわかります。彼らは通常、慎重に管理された環境でビデオデモを作成し、それをyoutubeに投稿しますが、実際には、ページ、レシピ、カードなどをスキャンすると、面白い結果が得られます。