PDFファイルをODTファイルに変換する方法は?


32

さらにファイルに変換できるよう.pdfに、.odtファイルをファイルに変換したい.doc。これを実行できるソフトウェア/スクリプトはありますか?.pdfファイルの内容をコピーして、フォーマットが保持されないliberofficeライターに貼り付けようとしました。

文書は機密情報ですので、変換のためにオンラインサービスを使用しないことを希望します。

どんな助けも大歓迎です。


関連(ただし、重複ではありません!):ODTをPDFに変換する方法は?
エリアケイガン

1
LIBREOFFICE / OpenOffice固有の質問については、ask.libreoffice.orgをお勧めします
Bucic

回答:


15

無料のPDFからODTへのコンバーターが不足していることに悩まされました。複雑なものさえ必要ありませんでした。ODTファイルを生成するツールで、LibreOfficeで注釈を付けることができます(フォームに記入するなど)。

PDFドキュメントをグラフィックファイルに変換してからLibreOfficeにインポートすることで、これを手動で行う方法を知っていますが、それは非常に手間がかかります。

そのため、必要なすべての手順を自動的に実行する、簡単な小さなシェルスクリプトをようやく作成しました。https://github.com/gutschke/pdf2odtで見つけることができます

任意の数のPDFおよび画像ファイルを入力として受け取り、LibreOfficeで開いて編集できるODTファイルを生成します。画像はページの背景として表示されるため、自由に上書きできます。各画像は、独自のページスタイルに関連付けられています。改ページを挿入するときは、そのことを念頭に置いて、必要に応じてページスタイルを調整してください。

LinuxとMacの両方でスクリプトをテストしました。適度に標準的なツールをほんの一握り必要とするだけであるため、非常に移植性が高いはずです。


このスクリプトは各ページのスクリーンショットを作成し、それらをターゲット形式にプロットします。スクリプトGutschke
Oliver

pdf2oo数年前に使用していましたが、LibreOfficeの破損ファイルが生成されるようになりました。このスクリプトはそれ以上のことを行います-ありがとう!
eacousineau

3
残念ながら、pdf2odtスクリプトは、ODTの背景として使用される画像形式に変換されます。元のテキストを「編集」できると期待しないでください。
リチャードエルキンス

13

あなたは見てとることができPDF Utilities含み(シナプスやapt-getを経由してのpoppler-utilsの)pdftotextを

Popplerは、Xpdf PDFビューアーに基づくPDFレンダリングライブラリです。

このパッケージには、PDFドキュメントの情報を取得したり、他の形式に変換したり、操作したりするためのコマンドラインユーティリティ(Popplerベース)が含まれています。
* pdfdetach-埋め込みファイル(添付ファイル)を一覧表示または抽出
* pdffonts-フォントアナライザー
* pdfimages-画像 抽出ツール * pdfinfo-
ドキュメント情報
* pdfseparate-ページ抽出ツール
* pdftocairo-Cairoを使用したPDFからPNG / JPEG / PDF / PS / EPS / SVGコンバーター
* pdftohtml-PDFからHTMLコンバーター
* pdftoppm-PDFからPPM / PNG / JPEG画像コンバーター
* pdftops-PDFからPostScript(PS)コンバーター
* pdftotext-テキスト抽出
* pdfunite-ドキュメントマージツール

もちろん、成功はPDFファイルの生成方法に依存します。あなたはテキストファイルとして欲しいものを得る場合は、その後、救うことができることを .odtファイルとして。

編集:見積もりの​​ソースを提供するのを忘れました。Synapticの説明タブからPDF Utilities (based on Poppler).


3
pdftohtmlHTMLはフォーマットを保持できるため、このリストからタスクに最適でなければなりません。次に、HTMLをODTまたはDOCに変換できます。
imz-イヴァンザカリヤシェフ

10

LibreOfficeは.pdfファイルをインポートできます。最適な結果を得るには、LibreOfficeの現在のバージョンで単に開いてください。ただし、ドキュメントは図面として開かれ、Writerドキュメントとしてではなく、サポートされている画像形式の1つにのみ変換できます。

当然、すべての書式設定が保持されるわけではありませんが、少なくとも一部は保持されます。


1
私は最近それを試しましたが、それはひどいです、それはフォーマットを少しでも保存しません。さらに、テキストをまったく読めなくします。
ハイエンジェル

3

場合のpoppler-utilsののパッケージがインストールされている、ノーチラススクリプト(実行可能ファイルとフォルダ〜/ .gnome2 /オウムガイ、スクリプトに配置する)以下は「-i」は含めて削除することができるオプション(HTMLに変換するPDFファイルを助けます画像も同様)、これはLibreOffice Writer開き、ODTとして保存できます、フォーマット変換の成功はPDFの作成方法に大きく依存します。

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym


この役立つスクリプトをありがとう。ちょっとした発言(からman pdftohtml):-noframes : generate no frames. Not supported in complex output mode.したがって-noframes-csetには何の効果もありません。
グルタニメート

2
おかげで、スクリプトからこの冗長なオプションを削除しました。これらすべてのオプションのGUIを提供する、Zenityを搭載したbashスクリプトは非常に素晴らしいと思われます;
サディ

#MHC、この情報は間違っているようです。-noframesを含めない場合、pdfページ用に個別のhtmlファイルを取得します。それでスクリプトにもう一度挿入しました。
サディ

それは奇妙です。その場合、ドキュメントの間違いである必要があります。それに応じて、スクリプトのコピーを変更します。ヘッドアップをありがとう!
グルタニメート

3

Calibreをお試しください。htmlに変換してから、他の形式に変換します。そうしないと、印刷する必要があった大きな(183ページ)ファイルでかなり良い仕事をしました。

私の場合、私はそれをepubに変換しましたが、楽しみのために.docxに変換しただけで非常にうまくいきました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.