紙の文書の写真をスキャン文書にするにはどうすればよいですか?


44

スキャナーが壊れました!私は良いカメラを持っているので、スキャンしたいドキュメントの写真を数枚撮りました...しかし、スキャンしたドキュメントではなく、紙の写真のように見えます:

  • 画像が平らではない
  • 照明は均一ではありません(ページがゆがむなどの影)
  • テキストは、コピー/貼り付け可能なPDFテキストに処理されません。

彼らは単にプロの使用に適していないだけですが、彼らは近いです。

上記のいずれかまたはすべてを実行できるもの(または方法)を探しているので、多数のJPGファイルから、適切な形式(A4、通常)。

何か提案がありますか(外出して新しいスキャナーを購入する以外)?


1
Androidでは、Googleのドライブアプリは少し処理を行い、一連の画像からA4サイズのPDFを取得します(新しい「スキャン」を作成します)-白黒と少しの補正を適用します(両方ともアプリで、作成)、ほとんど(低品質)スキャンに見えます。OCRはより難しい問題です。
ムル

Ubuntuソフトウェアは知りませんが、ほとんど同じことを行うアプリが携帯電話にあることを発見した後、スキャナーを破棄しました。Genius Scanアプリ(Androidの場合)またはScannable(iPhoneの場合)をご覧ください。次に、pdfjoinそれらをつなぎ合わせます。ただし、OCRはありません。
ジョス

モバイルアプリではなく写真でこれを行う理由は、私のdSLRが[文字通り]携帯電話のカメラよりも約1000倍優れているからです。そして、一挙にこれを行うものが何もない場合、私は実際に自分でOCRを処理できると思います。十分な仕事をする多くのオープンソースプロジェクトがあります。
オリ

粘着テープ、トースト、ジャムでスキャナーを蘇生させたので、緊急性はなくなりましたが、これはまだ興味深い問題だと思います。
オリ

オリ、私はこのtex.stackexchange.com/questions/94523/simulate-a-scanned-paperとこのstackoverflow.com/questions/8955425/のようなStackexchangeのいくつかの例をグーグルで検索しました… あなたの質問が正しいかどうか確かではありません;)
JoKeR

回答:


46

それにはいくつかの方法があります。提案されたすべての方法には1つの問題がありますが、実際にはあなたの写真が平坦化されることはありません。多少なりとも良好な画像が必要です。

1つの簡単な方法は、ソフトウェアScanTailorを試すことです

sudo apt-get install scantailor 

写真を最適化するには、6つのステップが必要です。最後のステップで、「照明を均等化する」オプションを選択できます。これにより、すっきりとした見た目が得られます。


個人的に私は通常GIMPを使用します。しかし、目標を達成するには基本的なスキルが必要です。

sudo apt-get install gimp 
  1. 必要な方法で画像をトリミングする
  2. Colors-> Curvesオプションを使用して、希望する方法でカラー出力を操作します...

きれいできれいな出力が得られるようにカラーカーブを調整します。


別の素敵なプログラムはgscan2pdfで、写真を読み込んでPDFとしてエクスポートすることもできます。GIMPへのリンクもあるため、上記の手順で写真を改善できます

sudo apt-get install gscan2pdf 

1
ScanTailorを見たことがない。保存したいもの(PDFなど)として保存する方法がわからないことを除けば、ほぼ完璧なようです。何か案は?
オリ

PS:Ask UbuntuとStack Exchangeへようこそ!
オリ

1
@Oli出力は、最初に選択したフォルダーに保存されます。今見ているように、tiffとして保存します。したがってconvert file.tiff file.pdf、コンソールでaを実行します。
wittich

2
ああ、私の悪い。複数のページを使用しているので、それらをpngに変換してからでfind -maxdepth 1 -name '*.tif' -exec convert {} {}.png \;結合しますpdfjoin --outfile output.pdf --a4paper --rotateoversize false *.png。私はこれをすべて行う方法を忘れたときに声を出して考えてください:)再びありがとう。
オリ

2
ScanTailorは発見でした!!! 私は通常、Gimpやgimpのようなプロプライエタリアプリでこれらすべてを行いますが、スキャンテーラーは、画像をスキャンしたような画像に変換するために必要な機能のみを備えており、すべてのノイズを除去します:) Gimpに移動します。どうもありがとうございました !!!
-Kostyantyn

20

文書のカメラ写真から印刷可能なコピーまたはPDFを生成するには、スキャナーからの出力に似た画像をかなり多く手動で変換する必要があります。これらの変換のほとんどはGimpで実行できます。

  1. 元のソース画像を最大限に活用してみてください:

    • ピクセルノイズを減らすために明るい光を選択しますが、反射、にじみ、不均一な光の分散を避けるため、スタジオフラッシュ機器がない限りフラッシュを使用しないでください。
    • 可能であれば、少なくとも2つの側面(上下または左右)から光源を照らすことを選択します
    • 広角レンズではなく望遠を使用して、より遠くから写真を撮ります。
    • アーティファクトが揺れないように三脚を使用してください。
    • カメラを光源の表面に垂直に向けます。
    • 元のソースに隣接するスペースを含めます。
  2. コントラストを改善し、カラーピクセルアーティファクトを除去するには、グレースケールへの彩度の低下を検討してください。

    ここに画像の説明を入力してください

  3. 明るさとコントラストを調整して、おそらく灰色の背景を白にし、黒い文字のピッチを黒にします。

    • これは、Gimp Colors> Levelsツールを使用してすばやく実行できます。このツールでは、ブラックポイント(左)とホワイトポイント(右)をドラッグするか、カラーピッカーでブラック/ホワイトポイントを選択できます。

    ここに画像の説明を入力してください

    • 曲がった角の影は、テキストの一部も削除せずに削除することはできません(6を参照)。
  4. クッションの歪みを取り除きますか?

    写真レンズの品質と使用したズームレベルによっては、クッションのアーチファクトが発生し、ドキュメントの外側の境界が曲がる場合があります。これらのアーティファクトも削除するプラグインがありますが、カメラのズームレベルを最小限に抑えて選択すると、より迅速に見つけることができます。切り抜いた後(5.)気付かないこともあります。したがって、クッションアーティファクトを削除する必要があるのは、ソースイメージの外側部分に多くの直線がある場合のみです。

  5. 必要に応じて、画像を回転およびトリミングまたは遠近法変換します。

    スキャナーとは異なり、カメラは画像の境界と平行してソースを取得できない場合があります。Gimp RotateまたはPerspectiveツールを使用すると、テキスト行がページに平行になるまで画像の遠近法を回転または調整できる視覚的なフィードバックが得られます。

    ここに画像の説明を入力してください
    右側のパースペクティブツール

これで、四角形選択ツールを使用してドキュメントソースを選択し、ドキュメント内の画像をトリミングできます。

  1. カメラレンズの曲げ、折り目、またはケラレのアーティファクトから不要な影を取り除きます。

    • これらの影を取り除くのは難しく、私たちを助けるプラグインや自動フィルターはありません。
    • 理論的には、これらの領域にグラデーション塗りつぶしを重ねることができますが、期待される結果にならない可能性があるため、必要な時間の価値がない場合があります。
    • したがって、最も簡単な方法は、消しゴムツールを使用して、テキストの外側にあるこれらのthoseい影をすべて削除することです(これは避けてください)。

      ここに画像の説明を入力してください 消去済み-> ここに画像の説明を入力してください

  2. 画像を拡大縮小しますか?

    カメラの解像度に応じて、画像をスキャナーの画像サイズに拡大すると、ファイルサイズが増加するだけで、画像品質には何のメリットもありません。縮小すると詳細が削除されます。そのため、画像を拡大縮小するのではなく、プリンタダイアログから印刷サイズを調整する必要があります(または下の8.)。

  3. PDFを生成

    きれいに手動で復元された画像をLibreOfficeにインポート(挿入>メディア)して、

    • 寸法を定義する
    • PDFとしてエクスポート
    • 印刷(私にとってLibreOfficeからの印刷は、他の何よりも頻繁に望ましい結果につながります)。

詳細な手順をありがとうございました。写真をスキャンしたドキュメントに変換するという長年の問題の解決に役立っています。遠近法変換の力に完全に感銘を受けました。
チェサンS.

素晴らしい答え!パースペクティブツールは最初はかなり混乱していたので、ここに素晴らしいガイドがあります。4本のガイドラインを追加してから、画像が4つのガイドラインすべてで正方形になるまで、遠近法ツールを使用して画像の角をドラッグします。
ガブリエルステープルズ

(24時間後)。おっと!リンクを忘れました。これが私が話していたガイドです:lifewire.com/…
ガブリエルステープルズ

1

ドキュメントの画像が既にある場合は、CamScannerアプリを携帯電話/タブレットにダウンロードするだけです。それはあなたが画像をインポートすることを可能にし、次に提案されたトリミングを行い、平らにすることができ、色/コントラストなどを調整することができます。ほんの数分かかります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.