サイズの大きいデータを処理する方法は多数あります。それの多くは、あなたの環境とどれだけのお金を使うかによって異なります。一般に、いくつかの全体的な「サーバーからデータを取得する」戦略があります。
- イーサネット経由ボックスに記載されているように、データは処理のためにSome Where Elseにストリーミングされます。20TBは、1GbEを超えるコピーに時間がかかりますが、それは可能です。ハードウェアが役立ちます(10GbEリンク、場合によってはNICボンディングなど)。
- ストレージサブシステム経由ファイバーチャネルを使用している場合は、FCネットワーク上の別のデバイスに送信します。SASがある場合は、SAS接続デバイスに送信します。一般的にイーサネットよりも高速です。
- 別のディスクアレイに送信する同じサーバーに接続されている別のストレージの塊に送信します。
それが100Kmビューです。ズームインを開始すると、さらに断片化されます。既に述べたように、LTO5は、この種の高密度負荷用に設計された特定のテープテクノロジーです。特にGlusterFSやDRBDなどを使用してそこにデータを取得できる場合は、別の同一のストレージアレイが適切なターゲットです。また、バックアップローテーションが必要な場合、またはアレイに障害が発生した場合に実行を継続する機能のみが、配置する内容に影響します。
100Kmの表示方法に決まったら、ソフトウェアに入ることが次の大きなタスクになります。これに影響を与える要因は、最初にストレージサーバーにインストールできるものです(NetAppである場合、ストレージを備えたLinuxサーバーは、ストレージを備えたWindowsサーバーとまったく同じです)。 、どのハードウェアを選択するか(たとえば、すべてのFOSSバックアップパッケージがテープライブラリを適切に処理できるわけではありません)、必要なバックアップ保持の種類。
どのような災害復旧が必要なのかを本当に理解する必要があります。単純なライブレプリケーションは簡単ですが、先週から復元することはできません。先週から復元する機能が重要な場合は、そのようなことを考慮して設計する必要があります。法律により(米国およびその他の地域では)、一部のデータを7年以上保存する必要があります。
簡単な複製が最も簡単です。これがDRBDの目的です。初期コピーが完了すると、変更が送信されるだけです。2番目のアレイがプライマリDRBDの近くにない場合、複雑な要因はネットワークの局所性です。少なくとも最初と同じくらいのストレージスペースを持つ2番目のストレージサーバーが必要になります。
テープバックアップについて...
LTO5は、圧縮なしで1.5TBのデータを保持できます。これらのモンスターに餌をやるには、ファイバーチャネルまたは6Gb SASの非常に高速なネットワークが必要です。強打で1.5TB以上をバックアップする必要があるため、オートローダーを調べる必要があります(ここに例があります:link、HPの24スロット1ドライブオートローダー)。それらをサポートするソフトウェアを使用すると、バックアップ中にテープの変更を処理します。彼らは素晴らしいです。オフサイトに送信するにはテープを引き出す必要がありますが、バックアップが必要なときにテープを一晩中ロードして自分でテープをロードするよりも、見た目が良いです。
テープが「レガシー、ew」のヒビゲージーを提供する場合、仮想テープライブラリの方が速度が向上する可能性があります(Quantum:linkのようなもの)。これらは、ソフトウェアをバックアップするためのテープライブラリのふりをしながら、実際には堅牢な(希望する)重複排除技術を使用してディスクに保存します。あなたがそのようなことを好めば、より洗練されたものはあなたのために仮想テープを実際のテープにコピーします。それはオフサイトの回転に非常に便利です。
仮想テープでさえいじりたくないが、ディスクへの直接バックアップを行いたい場合は、その20TBを処理するのに十分な大きさのストレージアレイと、必要な大量の変更データが必要になります保持するために。異なるバックアップパッケージは、これを異なる方法で処理します。重複排除技術の中には本当に素晴らしいものもあれば、ハッキーなものもあります。私は個人的にこの分野のFOSSバックアップソフトウェアパッケージの状態を知りません(私はBaculaのことを聞いたことがあります)が、それで十分かもしれません。多くの商用バックアップパッケージには、多くのメリットがあるスループットを向上させるために、バックアップするサーバーにローカルエージェントをインストールします。