PDFから単語への変換ソフトウェア?


回答:


18

openoffice(またはlibreofficeフォーク)両方ともpdfインポートプラグインと.docエクスポート機能を備えていますが、どちらの側面も変換の問題に悩まされています。これにより、変換の忠実度が常に100%とは限らないことを意味します。

OpenOfficeがシステムで動作しない場合、Abiwordも同様に機能します。


7
libreoffice --invisible --convert-to docx:"MS Word 2007 XML" file.pdfPDFをdocx / docに変換すると、「convert /home/file.pdf-> /home/file.docx using filter:MS Word 2007 XML、Error:Please verify input parameters ...(SfxBaseModel :: impl_store <file :///home/file.docx> failed:0xc10) "
-mohit

2
@mohitあなたの提案はDebian 8.5では機能しません。
レオレオポルトヘルツ준영

33

AbiwordからダウンロードするUbuntu Software Centerか、ターミナルで次のコマンドを入力してインストールできます。

sudo apt-get install abiword

次に、変換を実行します。

abiword --to=doc example.pdf

2
私はこの解決策に賛成票を投じましたが、2018-10-25現在、出力が完璧とはほど遠いことを人々に知らせなければなりません。フォーマットはまったく尊重されません。
ハンスデラゴン

14

PDF to Word onlineで大きな成功を収めました。これはデスクトップアプリケーションではなく、私が使用した他のものよりもうまく機能するサービスです。


ありがとうございます:) iveこれを前に出くわしました。しかし、デスクトップソフトウェアを探していました。これはあまり正確ではありません。
ビジェイ

5
個人的なドキュメントをアップロードする前に、このサービスのプライバシーポリシーも必ず確認してください。
グルタニメート

@neoより正確なサービス/ツールを見つけましたか?
アレックス

2018-10-25に試しました。フォーマットは完全ではありません。弾丸が失われ、インデントが間違っていた(おそらく弾丸がなくなったため)。それでも、試してみる価値はあります。たぶん、より簡単なPDFファイルで、それはより良くなるでしょう。しかし、私は非常に少数の書式設定エラーが発生した非常に良い仕事をしたこのオンラインサービスが見つかりました: pdf2docx.comを
ハンスDeragon


4

私は変換好むのPDFへの最初のファイルをHTML使用してpdftohtmlに含まのpoppler-utilsののの手段によって、たとえば、パッケージをノーチラススクリプトだけで、このコマンドからなります:

pdftohtml -noframes -q -p -c "$1" "${1%\.pdf}-img.html"

次に、結果のHTMLファイルをLibreOffice Writerで開き、(少し編集した後)好きな他のドキュメント形式として保存します

注:上記のコマンドに-iパラメーターを追加すると、画像のないHTMLファイルが生成されます。


これはナンセンスです。PDFから画像を作成するだけです。-iを指定すると、空のファイルが作成されます。
ホムンクルスレティキュリ

5
@HomunculusReticulliこのような評決を渡す前に、いくつかの異なるPDFファイルで試してください;-)おそらく、試したPDFファイルには実際には画像以外のテキストは含まれていません。この場合、一部のOCR認識ソフトウェアのみが役立ちます。
サディ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.