wgetを使用してhtmlファイルをダウンロードしましたが、ファイル内の画像はどこに保存されていますか?


15

Firefoxの読み込みが非常に遅いため、wgetHTMLファイルの保存に使用することにしました。次のコマンドを使用し、

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

ファイルはホームフォルダーに保存されていますが、画像の保存場所がわかりませんAnki。で使用する必要があります。

画像はどこに保存されますか?


この記事では、オプションとその有用性について説明します。
ウィルフ14年

回答:


34

ページを表示するのに必要なものはすべてダウンロードするが、他のページはダウンロードしないため、ここではなく--page-requisites-p略して)を使用することを好み-rます。

実際に私は通常のようなものを使用しています

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

これの意味は:

  • -E.htmlHTMLファイルであるが、末尾が.html類似していない場合はファイル名に追加する
  • -H:他のホストからファイルをダウンロードする
  • -k:ダウンロード後、ダウンロードされたファイルを指すようにリンクを変換します
  • -p:ページを適切にオフラインで表示するために必要なものをすべてダウンロードします

私が探してここに来た-H、と学ぶことが幸せだった-E-kあまりにも。ありがとう!
チャールズクレイトン

2

-rパラメーターを使用すると、wgetが画像を含むフォルダー全体をダウンロードできるようになります。

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

2

画像ファイルも個別にダウンロードする

このコマンドで開始できると思います。

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

画像を保存する場所と、必要なファイルの種類を指定できます。画像をダウンロードする方が簡単かもしれません。

ソース

-rは、再帰的な取得を有効にします。詳細については、再帰ダウンロードを参照してください。

-Pは、すべてのファイルとディレクトリが保存されるディレクトリプレフィックスを設定します。

-Aは、特定のファイルタイプのみを取得するためのホワイトリストを設定します。文字列とパターンが受け入れられ、両方をコンマ区切りリストで使用できます(上記参照)。詳細については、ファイルの種類を参照してください。

フォルダーから画像ファイルをコピーする

WebサイトがPNG画像ファイルを使用していることに気付きました。それらをフォルダからコピーするだけです。これは、Webページを保存したフォルダーで実行する必要があります。

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;

1

ページのHTMLファイル内の画像はURLとして書き込まれるため、Wgetはページ内の画像ではなく、ページのHTMLファイルを単にダウンロードします。必要な処理を行うには、-R(再帰的)、-A画像ファイルの接尾辞が付いた--no-parentオプション、オプション、昇順しない--levelオプション、およびを使用します1

具体的には wget -R -A .jpg,.png,.gif --no-parent --level <url>

さらに良いことに、ほとんどのブラウザにはオフライン表示用にページを保存する方法があります

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.