回答:
ページを表示するのに必要なものはすべてダウンロードするが、他のページはダウンロードしないため、ここではなく--page-requisites
(-p
略して)を使用することを好み-r
ます。
実際に私は通常のようなものを使用しています
wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
これの意味は:
-E
:.html
HTMLファイルであるが、末尾が.html
類似していない場合はファイル名に追加する-H
:他のホストからファイルをダウンロードする-k
:ダウンロード後、ダウンロードされたファイルを指すようにリンクを変換します-p
:ページを適切にオフラインで表示するために必要なものをすべてダウンロードします-H
、と学ぶことが幸せだった-E
と-k
あまりにも。ありがとう!
-rパラメーターを使用すると、wgetが画像を含むフォルダー全体をダウンロードできるようになります。
wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
このコマンドで開始できると思います。
wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
画像を保存する場所と、必要なファイルの種類を指定できます。画像をダウンロードする方が簡単かもしれません。
ソース:
-rは、再帰的な取得を有効にします。詳細については、再帰ダウンロードを参照してください。
-Pは、すべてのファイルとディレクトリが保存されるディレクトリプレフィックスを設定します。
-Aは、特定のファイルタイプのみを取得するためのホワイトリストを設定します。文字列とパターンが受け入れられ、両方をコンマ区切りリストで使用できます(上記参照)。詳細については、ファイルの種類を参照してください。
WebサイトがPNG画像ファイルを使用していることに気付きました。それらをフォルダからコピーするだけです。これは、Webページを保存したフォルダーで実行する必要があります。
find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;
ページのHTMLファイル内の画像はURLとして書き込まれるため、Wgetはページ内の画像ではなく、ページのHTMLファイルを単にダウンロードします。必要な処理を行うには、-R
(再帰的)、-A
画像ファイルの接尾辞が付いた--no-parent
オプション、オプション、昇順しない--level
オプション、およびを使用します1
。
具体的には wget -R -A .jpg,.png,.gif --no-parent --level <url>
さらに良いことに、ほとんどのブラウザにはオフライン表示用にページを保存する方法があります。