回答:
wget --recursive --level=inf --page-requisites --convert-links --html-extension \
--span-hosts=domainA,domainB url-on-domainA
更新:過去に上記のコマンドが機能していたことを覚えています(2010年で、 当時はWindows用のGNUツールを使用していました)。ただし、今日使用する場合は、次のように変更する必要がありました。
wget --recursive --level=inf --page-requisites --convert-links \
--adjust-extension --span-hosts --domains=domainA,domainB domainA
その短縮形は次のとおりです。 wget -rEDpkH -l inf domainA,domainB domainA
-r = --recursive-l <depth> = --level=<depth>-E = --adjust-extension-p = --page-requisites-K = --backup-converted-k = --convert-links-D <domain-list> = --domain-list=<domain-list>-H = --span-hosts-np = --no-parent-U <agent-string> = --user-agent=<agent-string>GNU Wgetマニュアル:https : //www.gnu.org/software/wget/manual/wget.html
domainA,domainB'; use on 'または' off '。オンに変更した後、機能しません。
wget --recursive --level=inf --page-requisites --convert-links --html-extension --span-hosts=example.org,iana.org example.org DebianでGNU Wget 1.13.4を使用しています。
--span-hosts --domains=example.org,iana.org-私--span-hostsはブール値である必要があると思う、それから--domainsどのホストをスパンするかを指定するために使用します。
wget --recursive --level = inf --page-requisites --convert-links --html-extension -rH -DdomainA、domainB domainA
wget --page-requisites --convert-links --adjust-extension --span-hosts --domains domainA,domainB domainA
robots.txtを無視する必要がある場合があります(これは一部の利用規約に違反している可能性があるため、最低限必要なものをダウンロードする必要があります)。https://www.gnu.org/software/wget/manual/wget.html#Robot-Exclusionを参照してください。