合理的な自動HTMLからPDFへの変換(UNIX / Linux環境)[終了]


16

LinuxでHTMLファイルからPDFドキュメントを自動的に生成する方法はありますか?PDFが入力ファイルと何らかの合理的なレベルの類似性を提供しますか?

何らかの種類の対話型GUIとは対照的に、コマンドラインツールが重要です。

htmldocもちろん、いくつかの関連するいとこを試しました。しかし、これらのツールは絶望的な石器時代です。 htmldocCSSをまったくサポートしていません。最近では CSSスタイリングを少なくとも備えていない多くのHTMLドキュメントは見つかりません。馬鹿げた効果や小さな装飾についてはあまり気にしませんが、最近の問題はCSSがほとんどのレイアウトの中心にあることです。ネストされたテーブルの6層を使用している人はもういません。そのため、変換ツールがCSSをまったく把握していない場合、「ドキュメントが正しく表示されない」だけではありません。ユーザビリティの最低基準をまったく満たしていない可能性があります。

Geckoレンダリングエンジンを使用してPDFに変換できる画像を生成しようとする人がいるようですが、簡単に言うまでもなく、どのようにこれを実行するのかわかりません。

これを行う優れた商用ツールがあると信じるのに問題はありませんが、できればオープンソースパッケージを探しています。その努力自体はオープンソースのものであり、費用はかかりません。

前もって感謝します!

回答:


7

wkhtmltopdfを見たことがありますか?個人的にどれだけうまく機能するかは言えませんが、まさにあなたが必要としているもののようです。これと「ブラウザ自動化」ソリューションでは、画面表示ではなく印刷スタイルシートが選択されるため、PDFが画面上に表示されるものとまったく異なる場合があります。


印刷スタイルシートとは何ですか?CSSユニバースの最新かつ最高の新しいものには触れないでください。
アレックスバラショフ

それは新しいことではなく、テーブルではなくレイアウトのためにCSSに切り替えた後、ほとんどのWebサイトで実用的になりました。alistapart.com/articles/goingtoprintまたはwebcredible.co.uk/user-friendly-resources/css/…を試してみてください。
robertc


2

XHTML2PDFは、コマンドラインスクリプトとPythonライブラリの両方を含むPythonツールセットです(スクリプトにシェルアウトすることなく、これをもっと大きなものに埋め込む必要があります)。フォーマットされた出力(ページ番号、段落フローなど)を調整します

いくつかのHTMLドキュメントをバッチ処理するためにほんの少しだけ使用しましたが、うまく機能し、その機能セットは私にとって包括的なようです。マニュアルはデモページに表示されていませんが、それ自体がHTMLドキュメントからPDFへの変換の良い例です。

「前」と「後」の例への素晴らしいリンクのセットがありましたが、アカウントを作成したばかりで、明らかに最初の投稿に複数のリンクを入れたのはスパマーだけです:-p


1

コマンドラインからHTMLページからPNGを生成したかった。どこかで、mozembedを使用してスクリーンショットを生成するルビースクリプトを見つけました。スケールしたくない場合は、スケール線を削除できます。

私が見る唯一の問題は、ページが実際にしばらく画面に表示されることです...


ええ、ええ。最後の部分は少しキラーのようです。これは、純粋にサーバー側のバックエンドに組み込む必要があります。ディスプレイヘッドなどはありません。それを達成する方法はありますか?
アレックスバラショフ

0

dompdfを試してください。deコマンドラインから正常に動作し、その例ではあらゆる種類のhtmlで動作します。


0

PrinceXML。CSSをうまく処理できます。Linux、Windows、Mac OS Xバージョンが利用可能です。AFAICS、これもGoogle DocsのPDF出力の背後にある技術です。しかし、注意:これは有料です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.