回答:
ありますxpdfの含まれるpdftotext
バイナリが。
Pdftotextは、Portable Document Format(PDF)ファイルをプレーンテキストに変換します。
Linuxでは、利用可能なインストーラーがあります。poppler-utils
パッケージにも入っているようです。OS Xでは、Homebrewを使用してインストールし(最初にインストール)、次に使用できます。
brew install homebrew/x11/xpdf
ソースファイルをダウンロードしてOS X用にコンパイルします。その後、次のように使用します。
pdftotext your_pdf_file.pdf
プレーンテキストファイルが生成されます。いくつかのオプションもありますman pdftotext
。詳細については、こちらをご覧ください。
OSXでの代替はpopplerです:
brew install poppler
Debianと友達
apt-get install poppler-utils
brew install Caskroom/cask/pdftotext
Windowsに適したツールはA-PDF Text Extractorです。
brew install homebrew/x11/xpdf