ネットワーク経由で20 TBのデータを転送するには、どのプログラムを使用する必要がありますか?


10

20TBのデータをサンダーボルトアレイにコピーする必要があります。データが存在するボックスには落雷接続がないため、これにはローカルの1GBネットワークを使用する必要があります。(はい、それは永遠にかかります)。

Filezilla / sftpを使用しようとしましたが、キューが非常に大きくなるとクラッシュしました。rsyncまたはscpを使用する方法はありますか?


2
古いデバイスからドライブを取り出して、直接接続できますか?

上記のコメントに同意します。物理転送の帯域幅は最大です。
思源レン

私はrsyncに基づく素敵なGUIユーティリティであるCarbon Copy Clonerが大好きです。開発者はrsyncを分岐し、多くの改善を行いました。私は速度対rsyncおよび/またはtarなどに話すことはできませんが、それはあらゆる種類のデータ転送に向いています。そうでなければ、CCCが教えてくれます。
Harv 14年

回答:


16

rsyncは良い方法です(scpは機能が少なくてもほぼ同じです)。-Zzlib圧縮を有効にするオプションを使用することもできます。ドライブ/コンピューターの速度によっては、非圧縮で送信するよりも高速になる場合があります。つまり、ネットワークリンクが飽和している場合です。アーカイブモードオプションも必要な場合があります。-aこのオプションでは、シンボリックリンク、アクセス許可、作成/変更時間を保持し、ディレクトリを再帰的にコピーします。コピーする内容に応じて、-E拡張属性とMacリソースフォークを保持したい場合があります。最後に、--progress進捗情報が表示されます。


11
rsyncは、中断がある場合にコピーを再開するのにも適しています。
リージョラモ14年

3
@LeeJoramoを再利用して、失敗した転送が中断した場所から再開できることが非常に重要です。転送は、この大規模なはなりますいくつかの点で失敗し、あなたが失うものは何でもあなたはその時点までに行った進行していないことを確認します。
blahdiblah

6

rsyncほどユビキタスではありませんが、過去に「mpscp」というツール呼び出しを使用しました-http ://www.sandia.gov/MPSCP/mpscp_design.htm

Sandia National Labsからは、SSHを介して実行されるファイルコピーツールであり、近接システム間で高速ネットワークを飽和させるように特別に最適化されています(10Gb +またはInfinibandを介して接続された同じサイトの2台のスーパーコンピューター間でテラバイトのデータをコピーするなど)。それはうまく機能しますが、セットアップには少し苦痛があります。テストでは、rsyncよりも2倍から3倍高速で実行されることが簡単にわかりました。


3

rsyncを使用し、rsyncdで使用することを検討してください。rsyncdを使用せずにrsyncを使用すると、sshの使用が滞ります。これは、何らかの暗号化を使用することを意味します。古いマシンから新しいマシンにデータをコピーしている可能性があります。古いマシンには、ギガビットイーサネットリンクを飽和状態に保つのに十分な速さでデータを暗号化するCPUがありません。両方の方法を使用してファイルのバッチ転送をテストし、どちらの方法が速いかを確認します。

同じ理由で、rsyncの圧縮オプションの使用をテストすることをお勧めします。圧縮は、CPUを集中的に使用するもう1つのアクティビティであり、古いハードウェアで試行した場合、ギガビットイーサネットの速度に対応できない場合があります。rsyncは15年前のプログラムで、最初の世界の国の大部分の人々がダイヤルアップモデム経由でインターネットにアクセスしたときに書き戻されました。その場合、ネットワーク帯域幅とCPUのトレードオフは大きく異なりました。


rsyncがデフォルトでsshを使用するのは正しいですが、それが唯一のオプションではありません。-eオプションを使用する代わりにrshを使用することができます。同じオプションで、sshのオプションを変更して、CPUをあまり使用しない暗号化などを使用できます-e 'ssh -c arcfour,blowfish-cbc'。これが最新のマシンで速度に差をつけるかどうかはわかりませんが、特に20 TBのファイルの場合、簡単なベンチマークは価値があるかもしれません。
マイケルDMドライデン14年

3

この20Tbは、少数の大きなファイル(ビデオ、モンスターデータベースなど)または何百万もの小さなファイルにパッケージ化されていますか?

小さなファイルがたくさんある場合は、再起動のためにrsyncを使用するか、効率のためにパイプされたtarストリームを使用します(多くの場合、1つのネットワーク接続、失敗した場合は最初からやり直します)

tar -cf - * | ( cd newhome; tar -xf - )

リモートフォルダをマウントする必要があります。

別のインターフェイスで新しいアレイを直接接続できますか?ローカルrsyncはsshを使用しないため、その障害ポイントを削除します。はい、Firewire 800はギガビットイーサネットよりも遅いですが、イーサネットを100%にロードすることはできません-firewireの方が速いかもしれません。参考までに、ボックスが十分に近い場合は、ファイアワイヤをネットワーク化することもできます。システム設定->ネットワークにインターフェースを追加します。


0

別のオプションは、Bittorrent Sync(http://www.bittorrent.com/sync)を試すことです。WANを介して家族のメンバー間で家族の写真やビデオを同期するために使用しましたが、ローカルネットワークで機能しない理由はありません。ピアツーピア接続を使用しているため、ドロップボックスのようなものを使用しようとした場合のように、データはサーバーを通過しませんデータ!)

複数のプラットフォームでもサポートされているため、rsyncやtarよりも柔軟性があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.