私は以前にこれを行ったことを知っているので、それが可能であると確信しています、私はそれを行う方法を忘れています。convertにPDFの特定のページを取得するように指示する方法があり、そのページの形式をPDFのままにしておきたいと思います。
私は以前にこれを行ったことを知っているので、それが可能であると確信しています、私はそれを行う方法を忘れています。convertにPDFの特定のページを取得するように指示する方法があり、そのページの形式をPDFのままにしておきたいと思います。
回答:
ImageMagickはビットマップ画像用のツールですが、ほとんどのPDFはそうではありません。使用すると、データがラスタライズされますが、これは望ましくないことがよくあります。
Pdftkは、PDFファイルから1つ以上のページを抽出できます。
pdftk A=input.pdf cat A42 A43 output pages_42_43.pdf
PDFLaTeXでLaTeXをインストールしている場合は、pdfpagesを使用できます。pdfpagesのシェルラッパーpdfjamがあります。
pdfjam -o pages_42_43.pdf input.pdf 42,43
別の可能性(ここではやり過ぎですが、1ページより複雑な要件には役立ちます)は、PyPdfライブラリを備えたPythonです。
#!/usr/bin/env python
import copy, sys
from pyPdf import PdfFileWriter, PdfFileReader
input = PdfFileReader(sys.stdin)
output = PdfFileWriter()
for i in [42, 43]:
output.addPage(input.getPage(i))
output.write(sys.stdout)
pdfjam
チャームのように動作し、すでにLaTeXディストリビューションとともにインストールされています。使い方はとても簡単です。
pdftk
単純にページを抽出したようには見えません。それ以外の場合、結果は良好でした。
添え字表記を使用convert(1)
してPDFに「インデックス付け」できます。
$ convert source.pdf[1] dest.pdf
インデックス値は、PDFエクスポーターがページに番号を付けた方法によって異なります。ここでのファイルのテストでは、数字は0から始まるように見えるため、上記の例ではドキュメントの2ページ目を取得します。PDFの作成者がその文書内のページをそのように「番号付け」したように見えるため、文字インデックスを代わりに表示する例をオンラインで見ました。
残念ながら、ImageMagickはすべてがピクセルベースであると想定しているため、典型的なPDFのタイポグラフィなどのベクター画像をラスタライズするため、これはあまり良い結果をもたらしません。
このジョブに適したツールはGhostscriptで、おそらく既にインストールされています。
$ gs -dNOPAUSE -dBATCH -dFirstPage=2 -dLastPage=2 -sDEVICE=pdfwrite \
-sOutputFile=dest.pdf -f src.pdf
GhostscriptはPDF(PostScriptの派生物)をImageMagickよりもはるかに深いレベルで理解するため、これはPDFデータを変更せずに渡します。
-density 300
はスイートスポットです。何か大きな、あなたは巨大な一時ファイル作成している-あなたはおそらくとにかくサムネイルにダウンサイズを変更しようとしている
source.pdf[3-6]
pdftk
ていた。あなたはそれを使いたいでしょう。