私は大学院生であり、私が働いているグループはLinuxクラスターを維持しています。クラスターの各ノードには独自のローカルディスクがありますが、これらのローカルディスクは比較的小さく、自動バックアップは装備されていません。そのため、グループは多くのTBのストレージスペースを持つファイルサーバーを所有しています。私は比較的Linuxに慣れていないので、速度、ネットワーク機能などの点でファイルサーバーの仕様がわからない。ローカルディスクがI / Oの点でファイルサーバーよりもかなり高速であることは経験から知っている。約十数人がファイルサーバーを使用しています。
cp
〜20 GBのファイルをファイルサーバーからローカルディスクの1つにコピーするために使用するには、平均で約11.5分かかります(によればtime
)。cp
(1)time
そのようなコピーのシステム時間は約45秒であるため、この操作はあまり効率的ではないことを知っています。(2)top
コピー中に調べると、%CPUは非常に低いため(検査により、平均で約0〜10%)。
cp
ローカルディスク上の1つのフォルダーから同じローカルディスク上の別のフォルダーに同じ〜20 GBのファイルをコピーするために使用すると、時間がかかりません-リアルタイムで約9分(システム時間では〜51秒time
)。そのため、ファイルサーバーは予想どおりローカルディスクよりも多少遅くなりますが、おそらくそれほど遅くありません。ローカルから同じローカルへのコピーが9分より速くないことに驚いています。
ファイルサーバーからローカルディスクの1つに、最大200個の大きなファイル(それぞれ20 GB以下)をコピーする必要があります。だから、私の質問は次のとおりですcp
。Linuxで大きなファイルをコピーするためのより高速な代替手段はありますか? (または、cp
コピーを高速化するために使用できるフラグがありますか?)このコピー時間を何らかの形で削ることができたとしても、それは非常に役立ちます。
新しい高速のハードウェアディスクを購入することは確かですが、そのようなリソースにアクセスすることはできません。私はシステム管理者でもありません-私は(初心者)ユーザーでしかありません-そのため、ディスクの負荷に関するより詳細な情報にアクセスすることはできません。毎日約12人がファイルサーバーを使用していますが、この特定のノード/ローカルディスクを使用しているのは私だけです。
dd
し、rsync
より高速な環境内のどの1作品を比較する
dd
、試しましたrsync
。によると、リアルタイムは約11.5分、システム時間は約1.5分でしたtime
。
/dev/sda1
への/dev/sdb1
コピーは、ある場所/dev/sda1
から別の場所/dev/sda1
または別のパーティションへのコピーよりも高速/dev/sda
ですSSDは明らかに異なります)。