このWebripper-Calluna SoftwareのようなUbuntu用のWebスパイダーを探しています。次のようにしてサイト全体をダウンロードできます
wget -r -m example.com
しかし、私が探している機能は、「Linux」などの検索語を入力すると、Webを検索してダウンロードできることです。Ubuntuにはこのようなプログラムはありますか?
このWebripper-Calluna SoftwareのようなUbuntu用のWebスパイダーを探しています。次のようにしてサイト全体をダウンロードできます
wget -r -m example.com
しかし、私が探している機能は、「Linux」などの検索語を入力すると、Webを検索してダウンロードできることです。Ubuntuにはこのようなプログラムはありますか?
回答:
httrack(CLI)またはwebhttrack(Webインターフェース)を試してみてください、それはユニバースリポジトリにあります。あなたが説明する検索用語の機能についてはわかりませんが、簡単に設定できるオプションがたくさんあります。
http ripperを試してみることができます。
ウェブサイトに投稿された機能は次のとおりです。
Free Software (GPL 3) Generic (works with almost every website) Runs on GNU/Linux and Windows Nearly undetectable / blockable by servers Built with python and pygtk
スクリーンショット
httpripperの開発者自身によるチュートリアルをご覧ください。
ダウンロードリンク:
Ubuntu 11.10 x64の下で私のために働いた
PerlのCPANには適切なモジュールがあります。ちょっとしたperlスクリプトが必要です。
特に、WWW:MechanizeモジュールでWWW:Mechanizeモジュールを見てください。