CSSイメージなどではなく、ページのみをwgetにダウンロードさせるにはどうすればよいですか?


10

wgetを使用してウェブサイト全体をダウンロードしたいのですが、画像、動画などをダウンロードしたくありません。

私は試した

wget -bqre robots=off -A.html example.com –user-agent=”Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6″

しかし、そうすると.phpファイルはダウンロードされず、静的な.htmlファイルがダウンロードされるだけです。

wgetを使用したこの問題の解決策はありますか?

回答:


6

wgetに.html接尾辞が付いているファイルのみを受け入れるように明示的に指示しました。

phpページにがあるとすると、次のよう.phpになります。

wget -bqre robots=off -A.html,.php example.com –user-agent=”Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6″

これは、phpのソースではなく、レンダリングされたhtmlをダウンロードすることに注意してください。ページが十分に動的である場合、期待どおりのレンダリング結果が得られない可能性があります。

ただし、httrackなどの別のツールの方が優れている可能性があることをお勧めします。


3

-Aはリストを取得するので、-A.html、.phpは目的に合うはずです。-Rも調べる必要があります(リジェクトリストも必要です)。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.