回答:
pdftotext
popplerに付属しているPDFで見つかったテキストを抽出しようとします。
イグナシオの答えは結構です。実際、それは私のリストの最初のものです。まあ、おそらく提案することをpdftohtml
ツールをもと組み合わせるのpoppler、と来ることpdfreflowあなたは段落などにテキストを再構築しようとする場合(もちろん、これはあなたのHTMLに出力を与えるであろうが、プレーンテキスト缶にHTMLに変換多くの方法で行われます。)
他にもいくつかのオプションがあります。
Calibreのebook-convert
コマンドラインツール。.PDFをプレーンテキスト(またはRTFまたはePubなどの多数の電子書籍形式)に変換できます。
pdftxtextract
ポドフォから
Abiwordをコマンドラインから呼び出して、入力/エクスポートできる形式間で変換し、適切なインポートプラグインを使用すると、これにはPDFが含まれます。
abiword --to=txt file.pdf
(公平には、AbiWordと口径はどちらもpopplerライブラリを使用していると思いますが、私は前向きではありません。)