回答:
あなたは明らかにAWSアカウントを持っているので、私は以下をお勧めします:
wget http://example.com/my_large_file.csv
。 s3cmd
ファイルをS3にアップロードするために使用します。例えば:s3cmd cp my_large_file.csv s3://my.bucket/my_large_file.csv
さまざまなAWSサービス間で行われる接続はAWSの内部ネットワークを利用するため、EC2インスタンスからS3へのアップロードはかなり高速です。自分のコンピュータからアップロードするよりもはるかに高速です。この方法により、ファイルをコンピューターにダウンロードする必要がなくなり、Webインターフェースを介してファイルをアップロードする時間を大幅に節約できます。
十分なストレージがあるEC2インスタンスを起動する
インスタンスにssh
ローカルマシンからのダウンロードに対応するcurlコマンドを取得します。Google Chromeの開発者向けオプションを使用できます->ネットワークタブ->コピー->カールとしてコピー(このステップは、Kaggleなどの認証を必要とする一部のWebサイトで必要です)
インスタンスターミナルからcurl
コマンドを実行します(コマンドに追加-o output_file
します)。これはファイルをダウンロードして保存します
インスタンスをs3に接続するaws資格情報を構成します(1つの方法は、コマンドを使用してaws config
、AWSアクセスキーIDとシークレットを提供することです)。
次のコマンドを使用して、ファイルをs3にアップロードします。
aws s3 cp path-to-file s3://bucket-name/
Awsのドキュメントを参照してください。http://aws.amazon.com/code ほとんどのプログラミング言語で使用できるライブラリがあります。したがって、バケットを作成し、コードからURLからデータをフェッチしてs3でこのバケットに書き込むように構成できます
たとえばpythonの場合:
from boto.s3.key import Key
k = Key(bucket)
k.key = 'foobar'
k.set_contents_from_string(url_data)