6
wgetまたはhttrackを使用してアーカイブされたWebサイトをミラーリングする際の問題
wgetを使用して、Webサイトのローカルミラーを作成しようとしています。しかし、すべてのリンクページを取得していないことがわかりました。 こちらがウェブサイトです http://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/ で始まるすべてのページが必要なわけではありませんがweb.archive.org、で始まるすべてのページが必要ですhttp://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/。 を使用するwget -rと、ファイル構造で web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/index.html, しかし、私はこのデータベースの一部であるすべてのファイルを持っていません、例えば web.archive.org/web/20110808041151/http://cst-www.nrl.navy.mil/lattice/struk/d0c.html. おそらくhttrackのほうがうまくいくかもしれませんが、今はそれをつかみすぎています。 それでは、どのようにしてインターネットアーカイブウェイバックマシンからアーカイブされたウェブサイトのローカルコピーを取得することが可能でしょうか?