既存のブラウザのクッキーを使用することができて、Javascriptを処理することができるWebスパイダ/ダウンロードプログラムを探しています[完了]


2

私はWebサイト*を蜘蛛にしてその内容をディスクにダウンロードするプログラムを探しています。私は私が試したプログラムを停止させるように見えるが、私は以下の要件を持っています。

  1. サイトのログオンプロセスは複数のページに分散されているので、Webブラウザでセッションを手動で開始し、認証してからスパイダーを起動してCookieにアクセスできるようにする必要があります。
  2. リンクの多くはJavascriptを実行してからコンテンツを返します。
  3. リンクの多くはPDF文書を返します(一部のスパイダーはこれをサポートしています)。

これまでのところ、私は#1と#2を処理することができるクモを見つけることができません。

*このサイトは請求書支払いサービスで、請求書の履歴があります。私はサービスの利用をやめたいと思っていますが、私はその歴史を守りたいのです。

回答:


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.