1.pdf、2.pdf、3.pdfなどに分割したい6ページのPDFファイルがあります。
プレビューは驚くほどうまくいきません(何かが足りない限り)。
コマンドラインからこの簡単なタスクを実行できるようになりたいと思いますが、この時点で(大ざっぱなソフトウェアをダウンロードせずに)仕事を終わらせるものなら何でも使用します
参考までにhttp://users.skynet.be/tools/は宣伝どおりに機能しません。
1.pdf、2.pdf、3.pdfなどに分割したい6ページのPDFファイルがあります。
プレビューは驚くほどうまくいきません(何かが足りない限り)。
コマンドラインからこの簡単なタスクを実行できるようになりたいと思いますが、この時点で(大ざっぱなソフトウェアをダウンロードせずに)仕事を終わらせるものなら何でも使用します
参考までにhttp://users.skynet.be/tools/は宣伝どおりに機能しません。
回答:
プレビューでPDFを開き、表示メニューでサムネイルを選択します。Ctrlキーを押しながら、デスクトップにドラッグアンドドロップするページを選択します。
これはを使用して実現できますpdfseparate
。homebrewを使用して、popplerをインストールできbrew install poppler
ます。これもインストールされpdfseparate
ます。PDF document.pdf
を単一のページ1.pdf
に分割するには2.pdf
、などを使用します。
pdfseparate document.pdf %d.pdf
コマンドラインからこれを行うことに興味がある場合は、Benjamin HanのsplitPDF pythonスクリプトを参照してください。例えば:
splitPDF.py in.pdf 3 5
ファイルin.pdf
を3つのファイルに分割し、ページ3と5で分割します。
seq
は、コマンドで一連の数字を簡単に作成できます。ありがとう!
python splitPDF.py MyPDF.pdf $(seq -s ' ' 1 10 411)
私のために働いた
別の選択肢については、この回答を参照してください。これは、ImageMagickコマンドラインツールを使用します。
convert x.pdf -quality 100 -density 300x300 x-%04d.pdf
ただし、品質に注意する必要があります。
ある範囲のページを抽出したい場合は、次のように呼び出すスクリプトを使用できます(システムのPATHのどこかにあるファイルpdfextract.pyに保存すると仮定します。たとえば、/ usr / local / binに実行を割り当てます。 chmod 744での許可(pdfextract.py):
pdfextract.py --file-in / path / to / large / pdf --file-out / path / to / new / pdf --start --stop
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import argparse
import os
import subprocess as sp
def main():
parser = argparse.ArgumentParser()
parser.add_argument('--file-in', required=True, type=str, dest='file_in')
parser.add_argument('--file-out', required=True, type=str, dest='file_out')
parser.add_argument('--start', required=True, type=int, dest='start', default=-1)
parser.add_argument('--stop', required=True, type=int, dest='stop', default=-1)
args = parser.parse_args()
assert os.path.isfile(args.file_in)
assert not os.path.isfile(args.file_out)
# remove temporary files
for el in os.listdir('/tmp'):
if os.path.isfile(os.path.join('/tmp', el)) and el[:12] == 'pdfseparate-':
os.remove(os.path.join('/tmp', el))
sp.check_call('pdfseparate -f {:d} -l {:d} {:s} /tmp/pdfseparate-%d.pdf'.format(args.start, args.stop, args.file_in), shell=True)
cmd_unite = 'pdfunite '
for i in range(args.start, args.stop + 1):
cmd_unite += '/tmp/pdfseparate-{:d}.pdf '.format(i)
cmd_unite += args.file_out
sp.check_call(cmd_unite, shell=True)
# remove temporary files
for el in os.listdir('/tmp'):
if os.path.isfile(os.path.join('/tmp', el)) and el[:12] == 'pdfseparate-':
os.remove(os.path.join('/tmp', el))
if __name__ == "__main__":
main()