Wget:リンクを変換し、既に取得したファイルの再ダウンロードを避けますか?


12

パブリッシュ後に変更されない複数のファイルに分散したデータをダウンロードしています。

したがって--timestamping、それは十分ではありません。なぜなら、変更されたリソースを常にチェックしているからです。これは、私の場合、まったく無意味です。

--no-clobber完全にフィットします。残念ながら--convert-links 、何らかの理由で動作しません。

--no-clobberと--convert-linksの両方が指定され、-convert-linksのみが使用されます。

私はそれ--backup-convertedが助けになることを望みましたが、それは何も変わりませんでした(それはうまくいき--timestampingます)。

なぜwget --convert-links --backup-converted --no-clobber --wait 1 https://example.com無視し--no-clobber、どうすれば修正できますか?


今日同じ問題にぶつかります。どのように解決しましたか?
アンジェロフックス

1
@AngeloFuchs私はそれを解決したことはありません(それが起こったら答えを投稿します)。最後に、私の場合、フェッチされたリンクの再ダウンロードは、wgetにパッチを当てたり、他のものに切り替えるよりも簡単でした。
アクティビティを減らす

試しました--continueか?これは通常、以前に中断されたダウンロードを継続するためのものです。ただし、ファイルが既に取得されている場合は何もしません。
JPT

回答:


1

rsyncを使用する可能性はありますか?システムへのsshアクセスが必要です。(http://ダウンロードにrsyncを使用したことはありません。)

このようなものは、あなたが一度も手に入れたことがないファイルを取得し、何らかの理由でダウンロードを停止したファイルを再ピックアップします。

rsync -avzheP ssh root@192.168.0.100:/remotefolder/ /localfolder/

これはうまくいかないかもしれません。あなたがしようとしていることについての十分な情報がありません。


-2

--convert-linksとの両方を使用することはできません--no-clobber。次のメッセージが表示されます。

Both --no-clobber and --convert-links were specified, only --convert-links will be used.

wget--convert-linksおよびを指定すると、必要な処理を実行できます--timestamping。ただし、これは、ターゲットサイトが応答ヘッダーでファイルのタイムスタンプ情報を提供する場合にのみ機能します。


この回答には、私の質問の最初のリビジョン(unix.stackexchange.com/posts/177330/revisions)で言及されていないものは何もありません。
アクティビティを減らす
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.