node.jsを使用した画像のダウンロード[終了]


169

node.jsを使用して画像をダウンロードするスクリプトを記述しようとしています。これは私がこれまでに持っているものです:

var maxLength = 10 // 10mb
var download = function(uri, callback) {
  http.request(uri)
    .on('response', function(res) {
      if (res.headers['content-length'] > maxLength*1024*1024) {
        callback(new Error('Image too large.'))
      } else if (!~[200, 304].indexOf(res.statusCode)) {
        callback(new Error('Received an invalid status code.'))
      } else if (!res.headers['content-type'].match(/image/)) {
        callback(new Error('Not an image.'))
      } else {
        var body = ''
        res.setEncoding('binary')
        res
          .on('error', function(err) {
            callback(err)
          })
          .on('data', function(chunk) {
            body += chunk
          })
          .on('end', function() {
            // What about Windows?!
            var path = '/tmp/' + Math.random().toString().split('.').pop()
            fs.writeFile(path, body, 'binary', function(err) {
              callback(err, path)
            })
          })
      }
    })
    .on('error', function(err) {
      callback(err)
    })
    .end();
}

ただし、これをより堅牢にしたいと思います。

  1. これを行い、これをよりよくするライブラリはありますか?
  2. 応答ヘッダーが存在する可能性はありますか(長さについて、コンテンツタイプについて)?
  3. 他に気にする必要のあるステータスコードはありますか?リダイレクトを気にする必要がありますか?
  4. 私はどこかでbinaryエンコーディングが廃止されることを読んでいると思います。それから私は何をしますか?
  5. これをWindowsで機能させるにはどうすればよいですか?
  6. このスクリプトを改善する方法は他にありますか?

理由:imgurに似た、ユーザーがURLを指定できる機能の場合、その画像をダウンロードして、画像を複数のサイズで再ホストします。

回答:


401

リクエストモジュールの使用をお勧めします。ファイルのダウンロードは、次のコードと同じくらい簡単です。

var fs = require('fs'),
    request = require('request');

var download = function(uri, filename, callback){
  request.head(uri, function(err, res, body){
    console.log('content-type:', res.headers['content-type']);
    console.log('content-length:', res.headers['content-length']);

    request(uri).pipe(fs.createWriteStream(filename)).on('close', callback);
  });
};

download('https://www.google.com/images/srpr/logo3w.png', 'google.png', function(){
  console.log('done');
});

1
涼しい!実際にダウンロードする前にサイズとコンテンツタイプを確認する方法はありますか?
Jonathan Ong 2012年

2
画像はどこにダウンロードしますか?
Gofilord、2014年

17
機能していない(画像が破損している
ダース

2
@Gofilordそのルートディレクトリにイメージをダウンロードします。
2016年

1
保存場所を変更できますか?特定のフォルダに保存したい場合は、
AKL012 2017年

34

数日前にこの問題に遭遇しました。純粋なNodeJSの答えとして、Streamを使用してチャンクをマージすることをお勧めします。

var http = require('http'),                                                
    Stream = require('stream').Transform,                                  
    fs = require('fs');                                                    

var url = 'http://www.google.com/images/srpr/logo11w.png';                    

http.request(url, function(response) {                                        
  var data = new Stream();                                                    

  response.on('data', function(chunk) {                                       
    data.push(chunk);                                                         
  });                                                                         

  response.on('end', function() {                                             
    fs.writeFileSync('image.png', data.read());                               
  });                                                                         
}).end();

最新のノードバージョンはバイナリ文字列ではうまく機能しないため、バイナリデータを扱う場合は、チャンクを文字列とマージすることはお勧めできません。

*「data.read()」を使用するときは注意してください。次の「read()」操作のためにストリームが空になります。複数回使用する場合は、どこかに保管してください。


7
ダウンロードを直接ディスクにストリーミングしないのはなぜですか?
geon

破損したファイルを作成したため、文字列を一緒にチャンク化することで多くの問題がありましたが、これはそれを行いました
Shaho

28

あなたは使用することができますAxios約束でお好みの順番でダウンロード画像にNode.jsのためのベースのHTTPクライアント)を非同期環境

npm i axios

次に、次の基本的な例を使用して、イメージのダウンロードを開始できます。

const fs = require('fs');
const axios = require('axios');

/* ============================================================
  Function: Download Image
============================================================ */

const download_image = (url, image_path) =>
  axios({
    url,
    responseType: 'stream',
  }).then(
    response =>
      new Promise((resolve, reject) => {
        response.data
          .pipe(fs.createWriteStream(image_path))
          .on('finish', () => resolve())
          .on('error', e => reject(e));
      }),
  );

/* ============================================================
  Download Images in Order
============================================================ */

(async () => {
  let example_image_1 = await download_image('https://example.com/test-1.png', 'example-1.png');

  console.log(example_image_1.status); // true
  console.log(example_image_1.error); // ''

  let example_image_2 = await download_image('https://example.com/does-not-exist.png', 'example-2.png');

  console.log(example_image_2.status); // false
  console.log(example_image_2.error); // 'Error: Request failed with status code 404'

  let example_image_3 = await download_image('https://example.com/test-3.png', 'example-3.png');

  console.log(example_image_3.status); // true
  console.log(example_image_3.error); // ''
})();

2
素晴らしい例!しかし、ほとんど読めないコード、標準スタイルを試してください:D
camwhite

3
@camwhite セミコロンが好きです。;)
Grant Miller

1
「finish」イベントと「error」イベントを書き込みストリームにアタッチし、Promiseでラップして、Promiseを返す必要があります。そうしないと、まだ完全にダウンロードされていない画像にアクセスしようとする可能性があります。
jwerre

アクセスを試みる前に、画像が完全にダウンロードされることを確認しないといけませんか?@jwerre
FabricioG

@jwerre @FabricioG返されたプロミスdownload_imageの「finish」イベントと「error」イベントをキャプチャするように関数を更新しました
Beeno Tung

10

進行状況のダウンロードが必要な場合は、これを試してください:

var fs = require('fs');
var request = require('request');
var progress = require('request-progress');

module.exports = function (uri, path, onProgress, onResponse, onError, onEnd) {
    progress(request(uri))
    .on('progress', onProgress)
    .on('response', onResponse)
    .on('error', onError)
    .on('end', onEnd)
    .pipe(fs.createWriteStream(path))
};

使い方:

  var download = require('../lib/download');
  download("https://www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png", "~/download/logo.png", function (state) {
            console.log("progress", state);
        }, function (response) {
            console.log("status code", response.statusCode);
        }, function (error) {
            console.log("error", error);
        }, function () {
            console.log("done");
        });

注:リクエストモジュールとリクエスト進行モジュールの両方をインストールする必要があります。

npm install request request-progress --save

2
これはうまくいきましたが、statusCodeチェックを追加することを提案したいと思いました。たとえば、500のstatusCodeはにヒットしません'on("error", e)。を追加するon('response', (response) => console.error(response.statusCode))ことにより、デバッグが大幅に容易になります
。– mateuscb

1
あなたは私の答えを編集できます:)
Fareed Alnamrouti

4

上記に基づいて、書き込み/読み取りストリームのエラーを処理する必要がある場合は、このバージョンを使用しました。なお、stream.read()書き込みエラーの場合には、私たちが読んで、トリガー終了することができますので、これは必須ですclose読み取りストリーム上。

var download = function(uri, filename, callback){
  request.head(uri, function(err, res, body){
    if (err) callback(err, filename);
    else {
        var stream = request(uri);
        stream.pipe(
            fs.createWriteStream(filename)
                .on('error', function(err){
                    callback(error, filename);
                    stream.read();
                })
            )
        .on('close', function() {
            callback(null, filename);
        });
    }
  });
};

2
stream.read()古くなっているように見え、エラーをスローしますnot a function
ベンデュラム

4
var fs = require('fs'),
http = require('http'),
https = require('https');

var Stream = require('stream').Transform;

var downloadImageToUrl = (url, filename, callback) => {

    var client = http;
    if (url.toString().indexOf("https") === 0){
      client = https;
     }

    client.request(url, function(response) {                                        
      var data = new Stream();                                                    

      response.on('data', function(chunk) {                                       
         data.push(chunk);                                                         
      });                                                                         

      response.on('end', function() {                                             
         fs.writeFileSync(filename, data.read());                               
      });                                                                         
   }).end();
};

downloadImageToUrl('https://www.google.com/images/srpr/logo11w.png', 'public/uploads/users/abc.jpg');

1
関数はコールバックをトリガーしません
crockpotveggies

4

これはCezaryの回答の拡張です。特定のディレクトリにダウンロードしたい場合は、こちらをご利用ください。また、varの代わりにconstを使用します。この方法で安全です。

const fs = require('fs');
const request = require('request');
var download = function(uri, filename, callback){
  request.head(uri, function(err, res, body){    
    request(uri).pipe(fs.createWriteStream(filename)).on('close', callback);
  });
};

download('https://www.google.com/images/srpr/logo3w.png', './images/google.png', function(){
  console.log('done');
});
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.