テキストを撮影するのに最適なカメラ設定は?


11

S95を使用して、OCRのテキストドキュメント(紙とマイクロフィルムの両方)を撮影しています。マイクロフィルム用のコンピューター画面を最もよく撮る方法の問題についてはすでに質問しましたが、テキストを鮮明でくっきりさせるためにテキストを撮る最善の方法を考えていました。私の現在の考えは次のとおりですが、私よりも写真の経験が豊富な人の意見を聞きたいと思います。

  1. 小さいメガピクセル数(S95の最大値である10MPではなく、約6〜7MP)を使用しているため、実際にスクロールして移動しても、PDFファイルによってコンピューターが強制終了されることはありません。

  2. 絞り-低い(例:f / 6.3)。カメラがページに正確に平行でない場合、テキストはフォーカスされたままになります

  3. シャッタースピード-ここではトレードオフがあります。ライブラリは一般的に光量が少ないため、シャッタースピードを下げて露出を増やしたいのですが、三脚がないと、カメラがぐらつく可能性があります。

  4. ISO-これがどのように影響するかは、私にはよくわかりません。

  5. ホワイトバランス-繰り返しになりますが、確かではありません。

私はカメラのさまざまな設定を試していますが、写真について学習しているだけです。本やドキュメントから、読みやすいテキストを最もよく撮る方法について誰かが何か提案があれば教えてください。


3
仕事に適したツールを使用してスキャナーを使用しないのはなぜですか?
ahockley

7
「なぜ仕事に適したツールを使用してスキャナーを使用しないのですか?」-私が使用するドキュメントの多くはスキャンできないため。それらは非常に壊れやすいか、ライブラリがスキャンを許可していないか、またはライブラリが$ 0.50 /ページ以上のスキャンに莫大な費用を請求しています。
Jason

2
私はそれが言われたことを望みます:私はあなたの使用が適切であれば著作権を適切に尊重することを望みます。:)そうだと思います、あなたがあなたの答えを見つけてくれることを願っています!
lindes

3
「あなたの使用が著作権を適切に尊重していることを願っています」-はい、私の作品は著作権の制限外のドキュメントを使用しています(私は歴史家で、主に19世紀後半のヨーロッパを勉強しています)
Jason

2
@ahockley:スキャンしない別の理由は、非常に長い時間がかかることです。DSLRを使用すると、テーブルトップで1分あたり約20ページを実行できますが、ドキュメントフィーダーを高速で使用し、コストがかかるスキャナーです。

回答:


7

カメラに白黒モードがある場合は、後処理時間を短縮するためにそれを試みます。さらに、私がこれまでに使用した多くのOCRプログラムは、白黒でより優れています。

手に持ったときの手ぶれを減らすために、シャッタースピードを最大にするために、おそらく最も広い絞りが必要になるため、ページにできるだけ平行になるようにします。s95の小さなセンサーはDOFを十分に大きくするので、私が絞りをできるだけ広く開けるようにします。

これをOCRで実行するつもりであることを考慮して、最小限のシェイクで適切な露出が得られるものまでISOをクランクしてください。OCRは、ぼやけた文字よりも余分なノイズについて不満を言う可能性がはるかに低くなります。

テキストについて話しているだけの場合、ホワイトバランスは、カメラの「屋内」設定が何であってもよいはずですが、率直に言って、あまり気にしないでください。

メガピクセルが問題になるのは、ドキュメントテキストが非常に小さく、その詳細レベルを明確に解決する必要がある場合だけですが、ほとんどの場合、6〜7で問題ないでしょう。


1
あなたはおそらく「ページに垂直」を意味します。あなたが平行している場合、テキストを読むのは難しいでしょう。;-)
Craig Walker、

@Craig Walker-彼はページに「平行」という用語を使用し、私は彼の意味を理解したので、私は彼を混乱させようとしませんでした。言うまでもなく、センサー自体もビューファインダーと同様に平行になります。それはあなたの参照するカメラのどの部分に依存します。この用語は意図的なものでした。
rfusca

可能な限り最大のメガピクセルを使用してください。OCRされたドキュメントは重要であり、ソースがすべてテキストである限り、それらは比較的小さく、とにかくカメラの解像度の影響を受けません。私はAbbyy FineReaderを使用しており、高解像度の画像(たとえば、10MPではなく21MP)でよりよく機能します。だから10MPで撃ちます。

けっこうだ。
Craig Walker

白黒モードの場合は+1。テキスト処理用のRGBはピクセルを浪費しています。
グレッグ、

2

あなたはすでに設定をよく理解しているようです。手ぶれは何よりもテキストの読みやすさを台無しにするので、私はそれを最初に最適化します。三脚を使用できない場合は、シャッタースピードが焦点距離(35mm換算)に対して少なくとも1であることを確認してください。ズームアウトすると、これが簡単になります。手ぶれ補正機能を使用します。

Apertureはかなり広く設定できます。ページと平行になるようにしてください。広い開口部はシャッタースピードに役立ちます。ここでも、広い開口部によるぼかしは、カメラの動きによるぼかしと比較して何もありません。

ISO、良い露出を得るために必要なものは何でも。ノイズは、本当に悪くなるまで読みやすさに影響を与えるべきではありません。

用紙自体に基づいてカスタムホワイトバランスを撮影することをお勧めしますが、OCRソフトウェアはオフホワイトの背景に対応できるはずです。


1
  1. あなたはJPEGをPDFに変換していると思います。最大をキャプチャし、プログラムを使用して6〜7 MPにダウンサイズし、ダウンサイズ後、PDFに変換する前にシャープネスを適用することをお勧めします。

  2. 明確にするために、より広い被写界深度に対してより狭いアパーチャ、つまりより高いFストップ値が必要です。(たとえば、f / 2ではなくf / 8が必要です)。読みやすくするためにテキストを使用する場合は、カメラをできるだけ垂直に向けて、被写界深度を気にする必要がないようにしてください。白地に黒のテキストで見られるCAなどの異常を減らすために、ワイドオープンから少し停止することをお勧めします。紙に近づくほど、被写界深度は浅くなります。

  3. あなたが握手している場合、これはおそらく読みやすさに最大の影響を与えるでしょう。手持ちの場合は、1 /(35mm相当の焦点距離)よりも速い、またはさらに速いシャッター速度を選択する必要があります。これは、P&Sで使用しているズーム設定によって異なります。ワイド端を使用すると、シャッタースピードを長くすることができますが、樽型の歪みが発生することがあります。コンピュータの画面ではなくテキストドキュメントを撮影する場合は、フラッシュを試すことをお勧めします。

    可能であれば、ドキュメントを上に支えて(テープまたは何かが平らになるように)、カメラを何かの上に置いて、シャッタースピードを必要なだけ長くできるようにします。お手玉や小さなオブジェクトを使用して、カメラが静止しているときにカメラを傾けることもできます。また、P&S用のウォーターボトル三脚アダプターを入手できます。

  4. 絞り、シャッタースピード、ISOが露出の三角形を形成します。それについてはこちらをお読みください。ISOが高いほど、絞りは狭くなり、シャッタースピードは短くなりますが、画像のノイズが多くなります。テキストのあるP&Sには、低ISO(400以下)をお勧めします。

  5. 照明の状況に合わせてホワイトバランスを選択します。蛍光がある場合は、それを使用してください。フラッシュを使用している場合は、フラッシュホワイトバランスを使用します。


ハンドヘルド屋内での撮影では、f / 8は現実的ではないと思います(フラッシュを使用する場合を除き、最初にライブラリに許可を求める必要があります)。さらに、f / 8は小さなセンサーで気を散らし、シャープネスゲインは最小限です。必要なシャッター時間/ ISOの増加と比較して。
Matt Grum、2011

@Matt f / 8は、より大きな数値で被写界深度を拡大したい(そしてCAのような他の収差を減らす必要があることを示す)例です。彼がどれだけの明るさを持っているかわからないので、私は彼にガイドラインを与えませんでした。気晴らし?回折ということですか?
Eruditass、2011

ええ、私は回折を意味しました-私は自分の電話でこれを書いています。これは、自分の単語を正しく綴っても、単語を自動修正するという厄介な癖があります。CAは(カメラの振れと比較して)大きな問題にはなりません。光が大きな問題である場合は、ワイドオープンから停止するのが最善だと思います...
Matt Grum

あなたはテクノロジーが好きではありませんか?ええ、私はワイドオープンからの1つの停止が良いガイドラインだと思います、そして、カメラの手ぶれが最も重要であることに同意します。
Eruditass、2011

これは、最大MPで撮影してから、コンピューターでダウンサンプリングすることをお勧めします。シャープ+追加のコントラストにより、テキストがよりシャープになり、読みやすくなると想像できます。
Jason、

1

利用可能な最高の解像度で撮影し、コンピューターで縮小するという提案に同意します。また、カメラから取得できる最高品質のjpegを選択するか、カメラで許可されている場合はraw撮影して、tiffまたはpngに変換します。jpegの不可逆圧縮は、インク/紙の境界の周りにアーティファクトを作成し、OCRソフトウェアを混乱させる可能性があります。

一般的に、あなたがやりたいことは、あなたが得ることができる最も鮮明な画像を得る設定を使用することです。コントラスト、ホワイトバランスなどはすべてコンピュータで変更できます。実際、PhotoshopまたはGIMPのレベルツールまたはコントラスト/明るさツールを使用してコントラストを上げると、非常に役立ちます。

また、グレースケール形式に変換すると、ファイルのサイズが大幅に縮小されます。そして、それを行い、コントラストを上げれば、ホワイトバランスを心配する必要はありません。ホワイトバランスを試すこともできますが、一部の設定では他の設定よりも優れたコントラストが得られる場合があります(照明によって異なります)。

コンピュータで処理できる場合は、ダウンサイズする前にすべての調整(グレースケール、コントラスト、明るさ)を行ってください。ダウンサイジングした後、画像にシャープフィルタを適用してください。


1

他に気づかなかったいくつかの考えをミックスに追加する:

  • あなたがいる場合撮影(以上、「ズームイン」望遠、それはあなたがして近づくになります隅にサイズのテキスト(言葉に対するあなたのより一貫性のある画像が得られますページから、さらに撮影する原因となります)中央の単語と同じサイズ。広角の場合、これに関して歪みが生じる可能性があります)。ここで「理想的な」設定が何であるかはわかりません。これは、必要なシャッタースピードとのトレードオフであり、潜在的に考えるべきことです。

  • 露出オーバー」に対して、カメラがおそらくデフォルトで正しいと考えているものを使用する必要があります(これが紙であると推測できるほど賢い場合を除きます-露出過度にしたくないので、引用符で囲みます。 、白いページのメータリングに基づいて露出オーバーにします)。これは、カメラが露出しようとする主なトーン(紙自体)が主なものになるためです。紙をミドルグレーとして露出すると、泥だらけの出発点。1ストップ半半から2ストップで「露出オーバー」にした場合(ハイライトをクリッピングするポイントに移動しないでください)、テキストはきれいで暗くなりますが、紙はきれいで明るくなり、コントラストが分離されます(したがって、OCR)がより簡単になります。

  • 照明均等にしてください-ページのある隅が他の隅よりもかなり明るいまたは暗い場合、これにより、OCRの目的で最も必要とする可能性のある純粋な黒と純粋な白に物を分離することが難しくなります。

  • 「コピースタンド」は、このようなプロジェクトに最適ですが、ライブラリで簡単に使用できるものを超えていると思いますが、ライブラリの構成方法によっては、どこかにある可能性があります(おそらくシェルフデスク、または照明などを保持するロッド?)ボールヘッドここでは1つですが、適切なサイズ(ヘッドによって異なります)の「スタッド」とある種の三脚を備えたスーパークランプを配置できます)頭はそうするでしょう)そして、あなたのカメラは机(または何でも)の表面の上にマウントされるようになるので、より長い露出が必要な場合でも安定した位置と安定性を保つことができます。基本的に、これは「貧乏人」のコピースタンドになります。

    また、短いセルフタイマーまたはリモート(カメラには2秒のセルフタイマーモードがあり、さらにカスタムモードのほうが短いと思います)を使用して、カメラのブレがボタンを押さないようにすることもできます。

私が今考えているのはそれだけです。うまくいけば、それは役に立ちます。


1

私はあなたの大陸の写真と同じ仕事をしていて、何年もの間それをしました。ほとんどの人は自分が何を話しているのか分からないので、信頼してください!!!

  1. Mまたはマニュアルのカメラ

  2. ISO 100-200高いほど#明るくなりますが、写真の粒子やノイズが多くなります

  3. シャッター速度1/100から1/160(通常は1/125が最適ですが、明るくなるほど明るくなりますが、埋没や再撮影が多くなります)

  4. Apertureまたはf2.7(フラットなページである深い視野が必要な理由)

  5. 6から10メガピクセルのカラーで撮影し、ホワイトバランス設定を確認します。通常は蛍光灯1または2で、ほとんどのベルをオフにしてください。

  6. ACDCを使用してコンプに写真を公開する


0

いくつかの小さな提案がありますが、あなたの設定は良さそうです

  1. 三脚を使用してください。これにより、手ぶれの問題がなくなり、必要なだけ長時間露光を使用できます。

  2. レンズにまっすぐ反射するような角度で紙に直接光が当たらないようにし、不要な場所でハイライトを発生させないようにします。これは通常、光が側面から来ることを確認することを意味します。

  3. ISO:経験則として、低い値に向かってエラーを発生させる必要がありますが、重要な違いはすぐに明らかになると思います。

それ以外は、セットアップを改善する方法は考えられません。正直なところ、あなたはそれを持っていると思います。


便利な(そして比較的安価な)三脚を提案して、カメラを裏返して、撮影しているページと平行になるようにしてください。私はJoby三脚を見てきましたが、それらは有望に見えますが、シャッターを押すと、それらが頻繁にシフトすることを聞きました。
Jason、

@ジェイソン、フェアポイント。気に入ったJobyがありますが、シャッターを切ったときに動かないようにするには、リモートシャッターを使用するか、セルフタイマーを使用します。これは、遅いシャッタースピードを使用しているときはいつでも良いヒントです。悪いニュースは、非常に安定するのに十分なほど重い三脚は安くはないということです。申し訳ありません!(別の方法で見つけた場合は、私に知らせてください!);)
AJフィンチ

0

あなたはほとんどの答えをすでに持っているようです:-P私はあなたのポイントにいくつかのコメントを追加します:

  1. 解像度:そのとおりです。特に、画面上で画像を表示するだけの場合は、ここでそれほど多くの解像度は必要ありません。私はおそらくそれを私自身の最大の典型的な画面解像度の2倍に制限するでしょう。

  2. 絞り:小さな絞りを選択して、被写界深度を少し揺らすことができます。ただし、おそらくそれほど多くは必要ありません。焦点距離に応じて被写界深度計算機を試して、妥当なDOFを計算してから、可能な限り最大の絞りを使用してください。(ただし、最高の鮮明さを得るために、最大絞りよりも1〜2程度絞ってください。)シャッターとISOを操作できるように、最大​​の絞りが必要です。下記参照。

  3. シャッター:十分な光を取得しながら、これをできるだけ速く振って軽減することをお勧めします。手ぶれを防ぐために「焦点距離に等しいシャッター速度」と主張するさまざまな情報源を聞いたことがあります。一部は二重を主張します。したがって、50mmレンズを使用している場合は、シャッター速度を1/50から1/100の間に保つようにしてください。それができたら、最も遅い速度で光を最大化してみてください。

  4. ISO:これをかなり高くブーストできるはずです。ノイズは画像の見た目を低下させる可能性がありますが、おそらくその可読性をあまり低下させません。「高ISO」と「うるさすぎる」とは、カメラによって異なります。実験。これはおそらく、絞りやシャッターと比較して、暗い場所で正しい露出を得るための最良の方法です。

  5. ホワイトバランス:あなたにとって、それはあまり重要ではありません。あなたの写真を撮った紙が白っぽく見える場合、それは重要ですか?(もちろん、フルカラーの写真を含む本を撮影している場合は別の話になります)。ポストで修正したい場合は、ニュートラルカラーの紙をたくさん使用するので、比較的簡単な時間になります。おそらくカメラをオートホワイトバランスのままにしておいて、忘れてしまいます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.