PDFファイルをODTファイルに変換する方法は？

32

さらにファイルに変換できるよう.pdfに、.odtファイルをファイルに変換したい.doc。これを実行できるソフトウェア/スクリプトはありますか？.pdfファイルの内容をコピーして、フォーマットが保持されないliberofficeライターに貼り付けようとしました。

文書は機密情報ですので、変換のためにオンラインサービスを使用しないことを希望します。

どんな助けも大歓迎です。

format-conversion

— アンキット
ソース

関連（ただし、重複ではありません！）：ODTをPDFに変換する方法は？

— エリアケイガン

1

LIBREOFFICE / OpenOffice固有の質問については、ask.libreoffice.orgをお勧めします

— Bucic

15

無料のPDFからODTへのコンバーターが不足していることに悩まされました。複雑なものさえ必要ありませんでした。ODTファイルを生成するツールで、LibreOfficeで注釈を付けることができます（フォームに記入するなど）。

PDFドキュメントをグラフィックファイルに変換してからLibreOfficeにインポートすることで、これを手動で行う方法を知っていますが、それは非常に手間がかかります。

そのため、必要なすべての手順を自動的に実行する、簡単な小さなシェルスクリプトをようやく作成しました。https://github.com/gutschke/pdf2odtで見つけることができます

任意の数のPDFおよび画像ファイルを入力として受け取り、LibreOfficeで開いて編集できるODTファイルを生成します。画像はページの背景として表示されるため、自由に上書きできます。各画像は、独自のページスタイルに関連付けられています。改ページを挿入するときは、そのことを念頭に置いて、必要に応じてページスタイルを調整してください。

LinuxとMacの両方でスクリプトをテストしました。適度に標準的なツールをほんの一握り必要とするだけであるため、非常に移植性が高いはずです。

— ガッチケ
ソース

このスクリプトは各ページのスクリーンショットを作成し、それらをターゲット形式にプロットします。スクリプトGutschke

— Oliver

pdf2oo数年前に使用していましたが、LibreOfficeの破損ファイルが生成されるようになりました。このスクリプトはそれ以上のことを行います-ありがとう！

— eacousineau

3

残念ながら、pdf2odtスクリプトは、ODTの背景として使用される画像形式に変換されます。元のテキストを「編集」できると期待しないでください。

— リチャードエルキンス

13

あなたは見てとることができPDF Utilities含み（シナプスやapt-getを経由してのpoppler-utilsの）pdftotextを：

Popplerは、Xpdf PDFビューアーに基づくPDFレンダリングライブラリです。

このパッケージには、PDFドキュメントの情報を取得したり、他の形式に変換したり、操作したりするためのコマンドラインユーティリティ（Popplerベース）が含まれています。
* pdfdetach-埋め込みファイル（添付ファイル）を一覧表示または抽出
* pdffonts-フォントアナライザー
* pdfimages-画像抽出ツール * pdfinfo-
ドキュメント情報
* pdfseparate-ページ抽出ツール
* pdftocairo-Cairoを使用したPDFからPNG / JPEG / PDF / PS / EPS / SVGコンバーター
* pdftohtml-PDFからHTMLコンバーター
* pdftoppm-PDFからPPM / PNG / JPEG画像コンバーター
* pdftops-PDFからPostScript（PS）コンバーター
* pdftotext-テキスト抽出
* pdfunite-ドキュメントマージツール

もちろん、成功はPDFファイルの生成方法に依存します。あなたはテキストファイルとして欲しいものを得る場合は、その後、救うことができることを .odtファイルとして。

編集：見積もりのソースを提供するのを忘れました。Synapticの説明タブからPDF Utilities (based on Poppler).

3

pdftohtmlHTMLはフォーマットを保持できるため、このリストからタスクに最適でなければなりません。次に、HTMLをODTまたはDOCに変換できます。

— imz-イヴァンザカリヤシェフ

10

LibreOfficeは.pdfファイルをインポートできます。最適な結果を得るには、LibreOfficeの現在のバージョンで単に開いてください。ただし、ドキュメントは図面として開かれ、Writerドキュメントとしてではなく、サポートされている画像形式の1つにのみ変換できます。

当然、すべての書式設定が保持されるわけではありませんが、少なくとも一部は保持されます。

— ベンダー
ソース

1

私は最近それを試しましたが、それはひどいです、それはフォーマットを少しでも保存しません。さらに、テキストをまったく読めなくします。

— ハイエンジェル

3

場合のpoppler-utilsののパッケージがインストールされている、ノーチラススクリプト（実行可能ファイルとフォルダ〜/ .gnome2 /オウムガイ、スクリプトに配置する）以下は「-i」は含めて削除することができるオプション（HTMLに変換するPDFファイルを助けます画像も同様）、これはLibreOffice Writerで開き、ODTとして保存できますが、フォーマット変換の成功はPDFの作成方法に大きく依存します。

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym

— サディ
ソース

この役立つスクリプトをありがとう。ちょっとした発言（からman pdftohtml）：-noframes : generate no frames. Not supported in complex output mode.したがって-noframes、-csetには何の効果もありません。

— グルタニメート

2

おかげで、スクリプトからこの冗長なオプションを削除しました。これらすべてのオプションのGUIを提供する、Zenityを搭載したbashスクリプトは非常に素晴らしいと思われます;

— サディ

#MHC、この情報は間違っているようです。-noframesを含めない場合、pdfページ用に個別のhtmlファイルを取得します。それでスクリプトにもう一度挿入しました。

— サディ

それは奇妙です。その場合、ドキュメントの間違いである必要があります。それに応じて、スクリプトのコピーを変更します。ヘッドアップをありがとう！

— グルタニメート

3

Calibreをお試しください。htmlに変換してから、他の形式に変換します。そうしないと、印刷する必要があった大きな（183ページ）ファイルでかなり良い仕事をしました。

私の場合、私はそれをepubに変換しましたが、楽しみのために.docxに変換しただけで非常にうまくいきました。

— クリストファー
ソース