PDFからテキストへのコンバーター[終了]


9

任意のPDFを取得してプレーンテキストに変換する「ワンクリック」の方法を探しています。OSXまたはLinuxが理想的です。

理想的には、ソリューションにはOCR機能が含まれますが、必ずしもそうである必要はありません。

最優先事項は、設定なしですべてのファイルを取得できるものを用意することです。

回答:


23

ありますxpdfの含まれるpdftotextバイナリが。

Pdftotextは、Portable Document Format(PDF)ファイルをプレーンテキストに変換します。

Linuxでは、利用可能なインストーラーがあります。poppler-utilsパッケージにも入っているようです。OS Xでは、Homebrewを使用してインストールし(最初にインストール)、次に使用できます。

brew install homebrew/x11/xpdf

ソースファイルをダウンロードしてOS X用にコンパイルします。その後、次のように使用します。

pdftotext your_pdf_file.pdf

プレーンテキストファイルが生成されます。いくつかのオプションもありますman pdftotext。詳細については、こちらをご覧ください。

OSXでの代替はpopplerです:

brew install poppler

Debianと友達

apt-get install poppler-utils

今日のコマンドはbrew install homebrew/x11/xpdf
Diego Vieira 2016年

1
@DiegoVieiraありがとう。次回は自由に編集を提案してください!
slhck 2016年

xpdf / pdftotextの代わりにpopplerを使用するいくつかの利点?
Gonzalo Bahamondez 2016年

brew install Caskroom/cask/pdftotext
Hugo

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.