wget --page-requisitesを拡張するスクリプト?


2

今日は非常によく似た質問を投稿しましたが、wget / linuxに焦点を当ててもう一度質問したいと思います。大丈夫だと思います。

できればPHPを使用して、LAMPスタック上にWebページのオフラインコピーをプログラムで作成する必要があります。HTMLソース、添付画像、CSSスタイルシートが必要です。

コマンドラインで実行できますが、新しいパッケージをインストールできません。

wget --page-requisitesアーカイブしたいページでa を実行できます。これにより、必要なものはすべてダウンロードされますが、ダウンロードされたHTMLおよびCSSファイルがアーカイブファイルを指すように変更されることはありません。

ダウンロードしたドキュメントを変更して、ダウンロードしたリソースを指す拡張機能/ Perlスクリプト/シェルスクリプト、またはこれを行う別のLinuxベースのソリューションを探しています。私はすでにチェックhttrackしましたが、サーバーにインストールされていないようです( "whereis httrack"は何も返しません)。

回答:


9

--convert-linksオプションを試してください:

ダウンロードが完了したら、ドキュメント内のリンクを変換して、ローカル表示に適したものにします。これは、表示されるハイパーリンクだけでなく、埋め込み画像、スタイルシートへのリンク、非HTMLコンテンツへのハイパーリンクなど、外部コンテンツにリンクするドキュメントのすべての部分に影響します。


どうやって見落とすことができますか?私はそれを試して報告します。
ペッカ웃
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.