Webページの完全なローカルコピーを取得する方法は?


6

どんなブラウザ(Chromeでも)を試したとしても、Webページをローカルファイルとして保存するとき、まったく正確ではありません。たくさんのJavaScriptなどがトリップするようです。Webページの100%完全なローカルコピーを取得する方法を探しています。つまり、すべてのCSS / images / JavaScriptsもプルダウンする必要があります。また、コンテンツへのHTML参照はローカルフォルダーを指すように変更する必要があります。これを行う方法はありますか?私は主にMacを使用していますが、Linuxにアクセスできます。


Firefox用のMozilla Archive Format拡張機能は、ブラウザでJavaScriptが実行された後、DOMの静的なスナップショットを保存できます。
機械式カタツムリ14

回答:


9

「JavaScriptが大量に発生するなど」と思われる理由は、おそらく多くの企業がコンテンツ管理システム(Joomla、Drupal、Wordpress)を使用しているためです。その場合は、必要なページ全体を取得することはできません。そのため、Webページに依存します。


6

HTTrackを使用してWebサイトをダウンロードしてみてください。このオプションを使用すると、ローカルにダウンロードされたファイルのリンク方法と、正確にダウンロードされるものを構成できます。Windows、Linux、およびMacのビルドが利用可能です。


1

あなたは、Fe(ただ、ダウンロードしたディレクトリを参照してください、その後、それを実行し、再びHttrackを実行し、除外... Httrack(あなたはそれが外部のJavaScriptをダウンロードしないように設定する必要があります)でWebサイト全体をダウンロードする必要があります- .googlesyndication.com / * - .facebook.net / - * google-analytics.com/**など)。

Wgetを使用することもできます。

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent http://www.yourdomain.com

完了したら、すべてのリンクを書き換えて、... / index.htmlを指さないようにする必要があります。これにより、動的HTMLから静的HTMLへのコンバーターが解決されます


0

Linuxを使用している場合は、このコマンドを試してください。「wget」-引用符なし。インターネットからより柔軟にダウンロードできます。

例:-端末タイプwget -m "www.example.com"

mは(ウェブサイトの)Mirrorの略です。Webサイトのダウンロードの深さを指定することもできます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.