のようなURLをダウンロードしようとしていますhttp://www.somesite.com/restaurants.html#photo=22x00085
。
単一引用符の間に挿入しましたが、正しいページではないhttp://www.somesite.com/restaurants.htmlのみをダウンロードします。
解決策はありますか?
のようなURLをダウンロードしようとしていますhttp://www.somesite.com/restaurants.html#photo=22x00085
。
単一引用符の間に挿入しましたが、正しいページではないhttp://www.somesite.com/restaurants.htmlのみをダウンロードします。
解決策はありますか?
回答:
wget
正常に動作しています。URI構文ことを指定フラグメント - #foo
部分は-クライアント側の完全に解釈されるべきである、といない文書自体を取得するときに使用。
たとえば、HTMLページの場合、ブラウザは指定されたセクションまでスクロールダウンするか、場合によっては特定の写真を表示するJavaScriptコードをトリガーします。
つまり、wget
懸念される限り、URI
http://www.somesite.com/restaurants.html#photo=22x00085
そしてhttp://www.somesite.com/restaurants.html
... 同じページを指します /restaurants.html
。残りの作業は、ブラウザ次第です。restaurants.html#photo=22x00085
ブラウザで開くと正常に動作するはずです。
適切なリンクにアクセスしないと、どのリンクかわかりませんが、2つのオプションしかありません。
ハッシュは、実際には要求されたドキュメントの名前の一部を形成します。この場合、エンコードできます:
それ以外の場合、通常の状況では、http://www.somesite.com/restaurants.htmlとhttp://www.somesite.com/restaurants.html#photo=22x00085は同じページを指している必要があります。ハッシュの後の部分は、ページをロードした後にブラウザがスクロールするアンカーを単に示しています。サーバーにも送信されません。
しかし、それはあるハッシュはJavaScriptを使用して、特定の写真をロードするために使用される(A-B)であることを、可能性。WgetはJavaScriptを解釈できないので、それについてできることは何もありません。
それは画像のURLではありません。スクリプトまたはその他のコードを使用して画像を取得するページのURLです。JavaScriptをオフにしてページをロードしてみてください。それがwgetが取得しているものです。
画像のURLを見つけるには、ブラウザでページにアクセスし、写真を右クリックしてください。URLなど、画像に関する情報を表示するオプションが必要です。
それでもうまくいかない場合は、Flashまたはその他のクライアント側プログラムを介して画像が読み込まれている可能性があります。FiddlerまたはWiresharkを使用して、どのURLがロードされているかを見ることができます。
画像を含むサイトの実際のURLを提供していただければ、画像のロード方法を判断するのに役立ちます。