オフラインでサイトを表示するためのWebサイトダウンローダー（キャッシュ？）

9

オフラインで表示するためにWebサイトのすべてのページをダウンロードまたはキャッシュするポータブルな方法はありますか？明日、クロスカントリーフライトがあります。いくつかのWebページ（特にpythonのドキュメントページ（http://docs.python.org/））とpyqtリファレンス（http：// www。 riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html）。

理想的には、Firefoxアドオンまたはそのようなものを望みますが、Linuxで実行できる限り、何でも問題なく動作します。

firefox website plugins

— ファルマリ
ソース

このオフラインWebサイトダウンローダーを試すことができます。

— Menelaos Vergis 2014年

15

HTTrackを使用しています。

インターネットからローカルディレクトリにWorld Wide Webサイトをダウンロードして、すべてのディレクトリを再帰的に構築し、サーバーからコンピューターにHTML、画像、その他のファイルを取得できます。

— エドガー
ソース

私は過去にこれを使いました、素晴らしい無料のソリューション。

— MaQleod 2010年

1

私はそれを愛する.. HTTrackは、LinuxとWindowsの両方のために最善であると、ダウンロードプロセスを設定するためのオプションの膨大なリストがあります

— eslambasha

私もそれを使いました。Androidバージョンも提供しています。

— gparyani 2014年

-1「すべてのディレクトリ」を構築するのではなく、「画像やその他のファイル」をすべて取得するわけではありません。リンク先のみを取得します。

— barlop

6

これらのオプションでwgetを使用して、オフラインで使用するためにサイトをミラーリングします

wget -cmkE -np http://example.com/a/section/i/like

どこ

-mは、サイトをローカルでミラーリングするためのミラーリングオプションをオンにします

-cいくつかのページを既にダウンロードしている場合に備えて、以前のダウンロードを続行します

-kは、オフラインで表示するために、絶対的なhrefをローカルなものを指すように変換します

-Eを指定すると、ダウンロード後にファイルの拡張子が.htmlになります。

-npは、/ a / section / i /の下のオブジェクトのみをダウンロードし、サイト全体をキャッシュしません。

たとえば、南のドキュメントはダウンロードしたかったのですが、南のチケットはダウンロードしたくありませんでした...

wget -cmkE -np http://south.aeracode.org/docs/index.html

私はWindowsを使用してcygwinでwgetを実行していますが、ネイティブのWindows wgetポートもあります。

あなたの場合、あなたはpython docsセクションからpythonオフラインドキュメントをダウンロードできますが

— メイサム
ソース

1

http://www.downthemall.net/ Firefoxプラグインを試してください。私はそれを使って、20ページ以上のファイルで250ページのPDFをダウンロードしました。それは非常に強力です。ワイルドカード/クエリ構文があり、必要なファイルのみを外科的に取得でき、不要なファイルは取得できません。

— ロルニク
ソース

1

私が知っているいくつかのFirefox拡張機能：

スクラップブック
Webページを保存し、コレクションを簡単に管理するのに役立ちます。主な機能は、軽さ、速度、精度、および多言語サポートです。主な機能は次のとおりです。
- Webページを保存
- Webページのスニペットを保存
- Webサイトを保存
- ブックマークと同じ方法でコレクションを整理する
- コレクションの全文検索とクイックフィルタリング検索
- 収集したWebページの編集
- Operaのメモに似たテキスト/ HTML編集機能
ScrapBook Plus
ScrapBook PlusとScrapBookの違い：
- より速いソート
- インポートとエクスポートの高速化
- ウィンドウを開いて、サイドバーから直接コレクションを管理します
- 「結合ウィザード」の処理を簡素化
- 「Capture Multiple URLs」の新機能（リンクを除外するフィルター、Webサイトのタイトルまたはリンクのタイトルをサイドバーのエントリーの新しいタイトルとして使用、ダウンロードまでの待機時間を0〜3秒で指定、UTF-8を使用）または文字セットとしてのISO-8859-1）
- 新しい「キャプチャ」ウィンドウ（ダウンロードは手動で開始する必要があり、自動スクロールはオフになっています）
- エディターの6つの蛍光ペン
UnMHT

MHT（MHTML）Webアーカイブ形式のファイルを表示し、テキストやグラフィックを含む完全なWebページを単一のMHTファイルに保存できます
Pocket（拡張機能ではなく、Firefoxの組み込み機能）

ワンクリックでWebページとビデオをPocketに保存できます。Pocketは、ページをすっきりと取り除き、ページをクリーンで邪魔にならないビューに保存し、外出先でPocketアプリからアクセスできるようにします。

ご了承ください：

FirefoxでPocketリストに保存してアクセスするには、インターネット接続が必要です。Pocketアプリを備えた他のデバイスではオフラインでの表示が可能です。

— 銀河系忍者
ソース

0

wgetを使用すると、Webサイト全体またはWebサイトの一部をダウンロードできます。

wget -r http://docs.python.org/

たとえば、帯域幅の使用を制限したり、再帰の深さを制御したり、除外リストを設定したりするために、渡すことができる他のオプションについてwgetマニュアルを確認してください。

オフラインブラウジングのもう1つの方法は、キャッシュプロキシを使用することです。Wwwoffleは、サーバー指定の有効期限のオーバーライドや再帰的なプリフェッチ機能など、オフラインブラウジングの保持を容易にする多くの機能を備えたものです。（私はダイヤルアップの日からwwwoffleを使用しています。）

— ジル 'SO-悪をやめる'
ソース