シートフィーダを使用してページをスキャンするときのエラー率を減らす方法


1

古いテキスト文書をスキャンしてから、いくつかのオリジナルを破棄したいと思います。

スポットチェックとは別に、許容できる程度に低いスキャン失敗率を得るために何ができますか?私は(スポットチェック後に)おそらく0.25%以下の失敗率を得たいと思います。失敗したページ、または判読できないページを失敗としてカウントします。

これは達成するのが難しい目標のようです。そもそも失敗率を減らすために何ができるでしょうか。

関連する質問(この質問は「QA」、つまり失敗を防ぐためのものです。リンクされた質問は「QC」、つまり失敗を検出するためのものです) シートフィーダを使用するときにスキャンしたページ数と品質を確認する方法


高品質の機器を使用するか、すべての文書を複数回(数回に分けて)スキャンする
Nifle

ばかげて電話してくださいが、何度もスキャンすることは考えていませんでした。それを答えにしませんか?一方、「高品質の機器を使用する」は、あまりにも漠然としていて、役に立ちません。
Croad Langshan

あなたがミスフィードのようなことについて話していない限り、スキャンは非常に一貫しています。ページが正常にフィードされると、結果は毎回同じになります。あなたは判読できない結果の潜在的な原因に対処する必要があります。それらは高品質のオリジナルにとって問題にならないでしょう。ソースは、物理的な状態が良くない原稿のようなもの、または紙の上の退色、変色、背景ノイズ、うまくスキャンできないコンテンツの色(明るい色、特に青)あなたはオリジナルを説明できますか?解決策はその問題に固有のものです。
fixer1234

1
「古い個人文書用のスキャナ+シートフィーダに重要な機能は何ですか」というあなたの平行した質問では、「ハードウェアに500ポンド以上のポンドを使うことはまずありません(そしてこれよりかなり少ないでしょう)」と述べました。ほんのわずかしか変化しない文書がある場合、あなたはあなたの目標(価格と品質に関して)を達成するかもしれません。そうでなければ、500 GBP未満でのあなたの期待は高すぎます。スキャナの品質(およびスキャンの結果)は、スキャナのハードウェアだけでなく、バ​​ンドルされているドライバやソフトウェアの品質によっても左右されます。
user291737

@ user291737:エラー率が手動チェック(およびスキャンの繰り返し)の後であると考えると、なぜそれがあふれているのでしょうか。この問題は、手動チェックを煩雑にすることなく、チェックなしで0.25%を達成しないように、チェック前エラー率を減らす方法についてです。
Croad Langshan

回答:


1

非常に多様な文書を使用してエラー率を下げるために 古い個人文書用のスキャナ+シートフィーダで重要な機能 ):

(A)「単純な」答え:     1.文書を同じ文書特性のバッチに分類します。     2.バッチごとに、スキャナドライバの設定を変えてテストスキャンを行います。テストサンプル内に「0.25%以下」という意図した失敗率でスキャンを生成する一連のドライバ設定が見つかるまでこれを行います。     3.これらのドライバ設定を使用して、残りのバッチをスキャンします。     4.スポットチェックを行い、スキャン結果が意図した失敗率の範囲内かどうかを確認します。     5.失敗率が高い場合は、手順2に戻って新しいテストサンプルを使用してドライバ設定を微調整するか、手順1に戻ってそれぞれのスキャナドライバ設定を使用してバッチを別々のバッチに分割します。

(B)(A)を使用すると、非常に単純な文書、つまり白、折れず、しわのない標準品質の用紙に白黒の片面印刷で、意図した失敗率に到達できるはずです。このような文書が多数ある場合は、バッチサイズがかなり大きくなる可能性があります。ただし、色紙、カラー印刷、スクリーン印刷された画像/グラフィック、薄い紙のにじみ、低コントラスト、黄ばみ、販売伝票の色褪せ、紙の損傷など、文書の属性が多ければ多いほど、スキャンに時間がかかります。 500 GBPの予算で取得されます。失敗率に達するためには、文書属性の変動をできるだけ少なくする必要があります。結果として、あなたのバッチサイズは減少します。あなたの文書によっては、あなたはあなたの失敗率の範囲内に留まるために他のすべての文書を多かれ少なかれチェックすることになるかもしれません。 あなたがより容易な文書検索のためにOCRを望み、あなたが異なる言語で文書を持っている場合、これは複雑さのさらなる次元を追加するでしょう。

(C)スキャナーに投げたものは何でも処理できると主張するプロ用ソフトウェアを購入する - 事前に文書を分類する必要はない。しかし     1.そのようなソフトウェアだけであなたの予算を膨らませるでしょう、     2.そのようなソフトウェアは、予算全体を使い果たし、追加のソフトウェアがまだ「欲しい」状態にある認定スキャナーでのみ機能します。


0

次のように、上記の私の答えのように、500ポンドの予算内で、0.25%以下の失敗率に達する可能性があります。

プロのスキャナーや後処理ソフトウェアを追加したコンピューターを含む、プロのスキャナーを貸し出す会社があります。予算内で1日か2日利用可能な待機中の使用とサポートの導入を含む機器(スキャナーとソフトウェア)を求め、類似の文書特性のバッチへの事前の並べ替えを最小限に抑えて最大の自動化を可能にする。

運が良ければ、予算内でほとんどの書類を一度にスキャンして特別な場合に備えて特別な場合に備えて機器を手に入れることができます。

このアプローチの利点:特定の価格帯でスキャナーとソフトウェアで可能なことがわかり、後で予算で独自のドキュメントスキャナーを購入したときに期待をよりよく調整できるようになります。この経験。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.