WebサイトのHTMLページから単一のPDFを生成する


0

ここに問題があります。参照のために頻繁に必要なWebサイトがあり、モバイルデバイスでも機能するオフラインバージョンが欲しいので、PDFが思い浮かびます。

wgetを使用してHTMLバージョンのオフラインコピーを作成できますが、これは問題ではありません。

私が本当に欲しいのは、内部リンクがまだ機能している状態で、すべてのHTMLページを単一のPDFに変換する方法です。そのため、Webバージョン上の別のURLを参照するリンクは、PDF内の対応するページを参照する必要があります。

理想的には、PDFに入れる目次を生成する方法も必要です。

どうすればこれを達成できますか?

Bash / Python / ruby​​ / whateverスクリプトやその他のコマンドラインも歓迎します。

(ところでOSX 10.9を使用しています。)


私の意見では、モバイルデバイス上のPDFは非常に恐ろしいものです。適切に作成されたHTMLは自動的に画面に合わせて適切にサイズ変更されるため、wgetから取得したHTML形式で保持する方がはるかに良い場合があります。それでもフルサイズを維持している場合は、PDFと同じになります。小さな画面で作業している間は、その画面サイズにとどまります。
ダリウス

この場合、PDFはほとんどiPadで読み取られるため、問題ありません。ただし、ePubも問題ありません。iBooksアプリにロードできるもの。
selfawaresoup

iBook上のPDFにはまだ問題がありますが、それは個人的な意見だと思います。HTMLをiPadで読み取り可能な形式に転送する方法がわかりませんが、オフラインページの読み取りに最も近いのは「ポケット」と呼ばれるアプリを使用することです(後で読む)。
ダリウス

いいえ、PocketまたはInstapaperは単一ページ専用です。多くのページがあるサイト全体が必要です。
selfawaresoup

2
キャリバーまたはシギルを見ましたか。こちらをご覧ください。試したことはありませんが、Calibreは、リンクされている場合は複数のHTMLから電子書籍を作成できるはずです。
リック

回答:


1

あなたは見てとるべきwkhtmltopdf、その中で宣伝高度な機能のリストから判断すると、無料のツールのマニュアルページを少なくともおよそあなたを満足させなければなりません:

複数のHTMLドキュメントをPDFファイルに印刷します。

X11サーバーなしで実行。

PDFファイルにドキュメントアウトラインを追加します。

PDFファイルにヘッダーとフッターを追加します。

目次の生成。

生成されたPDFファイルにリンクを追加します。

スクリーンメディアタイプを使用した印刷。

Webkitのスマートシュリンク機能を無効にします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.