CDに含める2つのサイトをダウンロードしようとしています。
http://boinc.berkeley.edu/trac/wiki
http://www.boinc-wiki.info
私が抱えている問題は、これらが両方ともウィキであることです。したがって、たとえば次のようにダウンロードする場合:
wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/
...?action = edit ...?action = diff&version = ...のようなリンクもたどるので、たくさんのファイルを取得します
誰かがこれを回避する方法を知っていますか?
画像なし、差分なしなど、現在のページだけが必要です。
PS:
wget -r -k -np -nv -l 1 -R jpg,jpeg,png,gif,tif,pdf,ppt http://boinc.berkeley.edu/trac/wiki/TitleIndex
これはバークレーで機能しましたが、boinc-wiki.infoはまだ問題を引き起こしています:/
PPS:
私は最も関連性の高いページのように見えるものを得ました:
wget -r -k -nv -l 2 -R jpg,jpeg,png,gif,tif,pdf,ppt http://www.boinc-wiki.info