回答:
wget
コマンドを使用してページをダウンロードし、次のように変数に読み込むことができます。
content=$(wget google.com -q -O -)
echo $content
-O
オプションを使用して、ページの内容wget
をwget
ダンプするファイルの名前を指定できます。私たちは、指定した-
標準出力にダンプを取得し、変数にあることを収集しますcontent
。-q
quietオプションを追加して、wget出力をオフにすることができます。
これにはcurlコマンドを使用することもできます。
content=$(curl -L google.com)
echo $content
-L
リクエストしているページが移動した可能性があるため、このオプションを使用する必要があります。その場合、新しい場所からページを取得する必要があります。-L
または--location
オプションでは、これで私たちを支援します。
src
ダウンロードした後、正しい要素の属性をそのページを。あなたがインストールする場合TQ、このコマンドはそれを行う必要があります:curl -s http://ww1.watchop.io/manga2/read/one-piece/1/4 | tq -j -a src "#imgholder a img" | xargs wget
convert_links = on
ていません-O-
。エラーで失敗しています-k can be used together with -O only if outputting to a regular file.
。それは期待されていますか?
コマンドラインからページを取得する方法はたくさんありますが、コードソースが必要かページ自体が必要かによっても異なります。
コードソースが必要な場合:
カールあり:
curl $url
wgetを使用:
wget -O - $url
しかし、ブラウザで表示できるものを取得したい場合は、lynxが役立ちます。
lynx -dump $url
私はあなたがこの小さな問題の非常に多くの解決策を見つけることができると思います、おそらくあなたはそれらのコマンドのすべてのmanページを読むべきです。そして$url
、あなたのURL に置き換えることを忘れないでください:)
幸運を :)
あるwget
コマンドまたはcurl
。
wgetでダウンロードしたファイルを使用できるようになりました。または、カールでストリームを処理することもできます。
リソース:
LWPがインストールされている場合は、単に「GET」という名前のバイナリが提供されます。
$ GET http://example.com <!DOCTYPE HTML PUBLIC "-// W3C // DTD HTML 4.01 Transitional // EN"> <HTML> <ヘッド> <META http-equiv = "Content-Type" content = "text / html; charset = utf-8"> <TITLE>ウェブページの例</ TITLE> </ HEAD> <ボディ> <p>「example.com」と入力してこのWebページにアクセスしました。 &quot; example.net&quot;、&quot; example.org&quot または&quot; example.edu&quot; ウェブブラウザに。</ p> <p>これらのドメイン名はドキュメントで使用するために予約されており、利用できません 登録のため。<a href="http://www.rfc-editor.org/rfc/rfc2606.txt"> RFCをご覧ください 2606 </a>、セクション3。</ p> </ BODY> </ HTML>
wget -O-
、curl
とlynx -source
同様に振る舞います。
あなたは使用することができcurl
たりwget
、生のデータを取得するために、またはあなたが使用することができw3m -dump
、Webページの素敵なテキスト表現を持っています。
$ foo=$(w3m -dump http://www.example.com/); echo $foo
You have reached this web page by typing "example.com", "example.net","example.org" or "example.edu" into your web browser. These domain names are reserved for use in documentation and are not available for registration. See RFC 2606, Section 3.