JavaScriptでポストペイントされたコンテンツを含むWebページをフェッチできるSeleniumRC以外の優れたツールはありますか?


8

の主な欠点の1つcurlは、最初のHTTP応答の後に発生するJavaScript AJAX応答によって主要なコンテンツがペイントされているウェブページが増えていることです。curlこのポストペイントされたコンテンツを取得することはありません。

したがって、コマンドラインからこれらのタイプのウェブページを取得するために、SeleniumRCを駆動してFirefoxインスタンスを起動し、これらのAJAX呼び出しが完了した後にソースHTMLを返すスクリプトをRubyで書くことに限定されました。

この種の問題には、より簡潔なコマンドラインソリューションを用意する方がはるかに優れています。誰か知っていますか?


上の誰の提案は何もここではないの誰もがカールを使用してWebアプリケーションでいくつかのタスクを自動化した経験がありますか?、しかしその質問は特にJavascriptをこすることについて尋ねていませんでした。
Gilles 'SO-悪をやめる'

回答:


2

最近、JavaでSelenium 2のWebDriverを使い始めました。JavaScriptを完全にサポートするHtmlUnitDriverと呼ばれるドライバーがありますが、実際のブラウザーを起動しません。

それは軽い解決策ではありませんが、仕事を成し遂げます。

コマンドラインから実行し、Webデータをファイルに保存するようにコードを設計しました。


2

Watirを検討しましたか?

http://watir.com/

パッケージを追加したら、スタンドアロンファイルとして、またはからirb、行ごとに実行できますinclude 'watir-webdriver'。私はそれよりも応答性が高いことがわかりましたがselenium-webdriver、複雑なテスト条件を解決するのに役立つテスト記録GUIがありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.