回答:
皆さん、すべての答えをありがとう。あなたの助けを借りて、ほとんどすべての関連するオフィス文書からページ数を抽出できるコマンドのリストをコンパイルすることができました。
DOCX / PPTX
unzip -p 'sample.docx' docProps/app.xml | grep -oP '(?<=\<Pages\>).*(?=\</Pages\>)'
unzip -p 'sample.pptx' docProps/app.xml | grep -oP '(?<=\<Slides\>).*(?=\</Slides\>)'
注:unzip
でインストールできますsudo apt-get install unzip
。
DOC / PPT
wvSummary sample.doc | grep -oP '(?<=of Pages = )[ A-Za-z0-9]*'
wvSummary sample.ppt | grep -oP '(?<=of Slides = )[ A-Za-z0-9]*'
注:(wvSummary
大文字と小文字が区別されます!)はwv
パッケージの一部です。でインストールしsudo apt-get install wv
ます。
ODT
unzip -p sample.odt meta.xml | grep -oP '(?<=page-count=")[ A-Za-z0-9]*'
pdfinfo sample.pdf | grep -oP '(?<=Pages: )[ A-Za-z0-9]*'
注:pdfinfo
はpoppler-utils
Ubuntuの一部であり、Ubuntuにプリインストールされています。
DJVU
djvused -e "n" sample.djvu
注:djvused
はdjvulibre-bin
パッケージの一部であり、とともにインストールできますsudo apt-get install djvulibre-bin
。
unzip -p document.odt meta.xml | grep -o 'page-count="[0-9]*"'