スキャンしたページから作成されたPDFを自動的にスキュー調整してトリミングするにはどうすればよいですか?[複製]


13

重複の可能性:
スキャンした画像の傾き補正に使用できるフリーソフトウェア

本のページのスキャンで構成されるPDFがいくつかあります。スキャンは一度に2ページから行われ、これらのスキャンの一部は歪んでおり、テキストがわずかに傾いているように見えます。

読みやすさを損なうことなくスキャンをデスキューすることで自動最適化を実行できるツールを探しています。GPLソフトウェアBrissがスキャンをトリミングして、2:1ではなく1:1のページ比率になるようにしましたが、ページをスキュー調整するツールはありません。

私がつまずいunpaper、私が何をしたいかにぴったりのようだ別のオープンソースツールを、しかし、そのツールは、Linuxだけであり、それは直接PDFファイルで作業をしません。

どんなヒントでも大歓迎です。


1
@random:この質問はなぜ閉じられたのですか?なぜこのトピックは「討論、議論、投票、または拡張討論」を求めるべきなのでしょうか?!?
カートPfeifle

1
「ツールを探して、」建設的ではないに近い理由@kurへのサービスのリード線のためのほとんどのポーリングである
ランダム

1
@random:この質問により、このトピックに関する調査を行うことになり、興味深いオプションが見つかりました。最も興味深いのは、ImageMagickをこれに使用することであり、驚くほど単純なようです。残念ながら、これを終了しても、回答を投稿することはできません。
カートPfeifle

@ランダム:質問を少し編集しました。うまくいけば、それがあなたの「建設性」の感覚により適合するようになりました。
カートPfeifle

@random:わかりました。この場合、「複製として閉じる」の方が適切です。
カートPfeifle

回答:


9

見ていデスキューを。これはコマンドラインツールです。ダウンロード* zipには、Windows、MacOSX、およびLinuxのバイナリが含まれているようです。

ライセンスは、MPL(Mozilla)またはLPGL(GNU)です。

唯一の欠点は、PDFを消費せず、PNGおよびTIFF画像(AFAICS)のみを消費することです。つまり、s.thのワークフローを設定する必要があります。お気に入り:

 PDF.orig -> PNG.orig -> PNG.deskewed -> PDF.deskewed

私はまだテストしていませんが、最近ウェブサイトを見つけてブックマークしました。


deskewテスト実行で回転関連の歪みを修正できましたが、残念ながら元の画像の境界の位置に細い灰色の線が導入されました。灰色の境界線を取り除くには、-extentオプションで画像を切り取りましたmogrify。私はOS Xでしかテストしていませんが、この誤動作はプラットフォーム固有のものです。
ステファンシュミット

deskew本当にうまくいきます。私のワークフローは次のとおりですpdfimages-all <pdf> my_imagesjbig2 -s -p -v my_images* > outputpdf.py output > deskewed.pdf黒い境界線(傾き補正操作の結果)が気になる場合、@ StefanSchmidt
Mr. Tao

5

ああ、別の答えを追加させてください。netpbmを思い出しました。何年も使用していませんが、私は新鮮な外観を取る必要があると思います...

netpbmは、グラフィックイメージを操作するコマンドライン用の非常に強力なツールキットです。300個近くのツールが付属しています。約100のグラフィックス形式のコンバーターが含まれています。

また、画像を回転できるコマンドラインツールもあります。

pnmrotate

そして、回転した画像の角度を発見しようとする別のツールがあります:

pamtilt

pamtilt画像回転の推測の浮動小数点数を返します。したがって、画像の自動歪み補正は手の届く範囲にある必要があります。そのためのシェルスクリプトを作成できます。別の手順が必要です。

  1. Ghostscriptを使用して、PDFページをnetpbmに適した画像形式に変換します。
  2. pamtilt画像のスキュー角を自動検出するために使用します。
  3. pnmrotate画像の歪みを補正するために使用します。
  4. 画像をPDFに再変換します。

あなたのPDFファイルの小さなサンプルへのアクセスを提供してくれたなら、この偉業を成し遂げるためのシェルスクリプトを試してみてください。


([netpbm]がスーパーユーザー+スタックオーバーフローにここにタグを付けていないことを非常に不思議に思っています。)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.