タグ付けされた質問 「ocr」

3
クロマサブサンプリング:データレートを適切に計算する方法
たとえばY'UV画像でクロマサブサンプリングを利用するときにデータレートを計算する方法を理解するのに苦労しています。 以下の計算例があります。 画像解像度:352*288 周波数:25 fps 以下のために(:4:4 4)以下のように計算例を行きます: (352px * 288px) * 3 color channels * 25 fps * 8 bit = 60 825 600 bit/s ここまでは順調ですね。 しかし、今来る(4:2:0): (352px*288px) * 1.5 color channels * 25 * 8 = 30 412 800 bit/s さて、この例を例(4:1:1)に変換しようとすると、1.5カラーチャネルの比率がどのように計算されるかを正しく理解しているかどうかわかりません。 計算の最初の推測は(4:2:0)の場合でした: 2/4*3=1.5 color channels 同様に(4:1:1)の場合、カラーチャネルの比率を次のように計算します。 1/4*3=0.75 color channels …

2
OCR処理用の「ハーフトーン」画像のフィルタリング
スキャンしたPDF資料に非表示のテキストレイヤーを追加したいので、ドキュメントにインデックスを付けます。私はghostscript白黒のtiff出力デバイス(tiffg4)を使用して、ページをtiff画像として抽出しました。以下に、それらがどのように見えるかの例を示します。 この画像をテッセラクトで処理しても、良い結果は得られません。 ghostscript出力DPI(600、300、150、96)を変更すると、96 DPIの画像がテッセラクトから最良の結果が得られることを示していますが、それでも十分ではありません。 次に、OCR処理用にこのフィルターを強化するフィルターについてアドバイスを求めようと思いました。 imagemagick、またはnumpy / scipy / ndimageを使用できます

1
円形画像のOCRに推奨される前処理方法
こんにちは、これは私のサンプル画像です。このような画像でリアルタイムに文字を検出します。 前処理なしで、元の画像でSURF、SIFT、MSER、およびテンプレートマッチングを試しました。文字を検出することはできますが、画像が変化しても、画像上の文字に多くの関心のあるポイントがないため、この機能検出方法は機能しません。精度を上げるためにどのような前処理を行うべきか、正確にはわかりません。 だから私の質問は、皆さんがより高い精度で文字検出を行うためにどのような方法を提案できるかです。 前もって感謝します。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.