コンピュータユーザー webarchive

wgetまたはhttrackを使用してアーカイブされたWebサイトをミラーリングする際の問題

wgetを使用して、Webサイトのローカルミラーを作成しようとしています。しかし、すべてのリンクページを取得していないことがわかりました。こちらがウェブサイトです http://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/ で始まるすべてのページが必要なわけではありませんがweb.archive.org、で始まるすべてのページが必要ですhttp://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/。を使用するwget -rと、ファイル構造で web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/index.html, しかし、私はこのデータベースの一部であるすべてのファイルを持っていません、例えば web.archive.org/web/20110808041151/http://cst-www.nrl.navy.mil/lattice/struk/d0c.html. おそらくhttrackのほうがうまくいくかもしれませんが、今はそれをつかみすぎています。それでは、どのようにしてインターネットアーカイブウェイバックマシンからアーカイブされたウェブサイトのローカルコピーを取得することが可能でしょうか？

12 linux wget httrack webarchive

タグ付けされた質問 「webarchive」

タグ付けされた質問「webarchive」