OCRのトレーニングデータを生成する方法


7

ライセンスプレート(インドネシアのライセンスプレート)を認識するための光学式文字認識システムを構築しようとしていますが、残念ながら利用可能なトレーニングセットはありませんが、フォントを見つけました。 (ガウスぼかし、ボックスぼかしなど)Pythonを使用しますが、実際のデータとは異なります。フォントは次のようになります。 ここに画像の説明を入力してください

そして、私はこのように見える個々の手紙を生成したいです:

プラットケンダラーン

上の画像のようなトレーニングデータを生成する方法はありますか?ありがとうございました


データセットの作成についてはどうですか?あなたのシステムは何に使用されていますか?ラベルなしのデータを簡単に取得できますか?
Martin Thoma

データセットを取得するのは難しいです。ラベルのないデータセットでも、データセットは車のプレートのライセンスレターのトリミングされた画像である必要があります。このシステムは、ライセンスプレート番号の読み取りに使用されます
Kiki Rizki Arpiandi 2016年

数字の分類に深い畳み込みニューラルネットワークを使用し、テキストを検出するためにストローク幅変換を使用し、k-meansクラスタリングテキストのセグメンテーションを使用しました
Kiki Rizki Arpiandi

回答:


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.