wget --content-disposition 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
ダウンロードするファイルは、tar
アーカイブ(バイナリファイル)であり、Webサーバーからのダイナミックリンクによって提供されます。wget
通常は、使用しているURLの一部を使用してファイルを保存しますが、この場合、それは単なるREST APIエンドポイント(または類似のもの)であるため、名前は扱いにくくなります(有効な名前であり、ファイルの内容は同じです)。
ただし、この場合、サーバーは実際のファイル名を含む「Content Disposition」ヘッダーを提供wget
し--content-disposition
ます。これは、オプションを使用する場合に使用できます。このオプションは、私のマニュアルで「実験的」とマークされていますwget
。
また、シェルが&
との?
文字を解釈しないように、URLを引用符で囲む必要があります。
同等のものを使用してcurl
:
curl -J -O 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
または、同等の長いオプションを使用します。
curl --remote-header-name --remote-name 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
ファイルをダウンロードしたら、解凍する必要があります。
tar -xvf GSE48191_RAW.tar
この特定のアーカイブの作成方法により、これによりアーカイブのファイルが現在のディレクトリに解凍されます(新しいディレクトリを作成し、そこにアーカイブを移動して解凍することをお勧めします)。このアーカイブ内のファイルは- gzip
圧縮されたCEL
ファイルです。