ビジネスクリティカルなデータを火災から保護するにはどうすればよいですか?


24

Webキャストインベントリを含む72台のハードドライブがあります。数は増加しています。私たちは骨組みの建物の中にあり、火災だけでなく壊滅的な火災を恐れています。

ハードドライブに必要な125Fを保持する耐火金庫の価格を設定しました。彼らの価格は屋根を通してです。

各ハードドライブのバックアップを作成して、どこか別の場所に保存したり、オンラインバックアップストレージ会社と契約したりした場合、バックアップドライブを購入する法案が発生し、金庫のコストが7,000ドルに達する可能性があります!

火災のリスクからデータを保護する最良の方法は何ですか?


37
オフサイトのバックアップはありませんか?あなたは...火災の危険性よりも大きな問題をhvae
HopelessN00b

2
さて、これで邪魔にならず、正確にどれだけのデータを持っているのでしょうか?ハードドライブのサイズはさまざまであるため、「72台のハードドライブ」では問題の範囲を十分に把握できません。
マイケルハンプトン

18
火だけ?水道管が破裂し、金庫に浸水するのはどうですか?竜巻は安全を運びますか?オフサイトバックアップに代わるものはありません。ディスクのコストを金庫のコストと比較することは無効です。Webcastインベントリを失うコストと比較する必要があります。
jqa

26
あなたのデータは7,000ドルの価値はありませんか?
psusi

2
コンテンツ配信ネットワークがより適切で、セルフホスティングやオフサイトと同じくらい費用対効果が高いでしょうか。特にウェブキャストアーカイブの場合はどうですか?
JustinC

回答:


29

まず、最初に、常にデータのオフサイトコピーを保持する必要があります。火災が発生する可能性があるだけでなく、自然災害や同様のイベントが発生して建物にアクセスできなくなった場合はどうしますか?オフサイトでデータのコピーがなければ、あなたはうんざりしています。

つまり、データのオフサイトコピーを作成するには2つの方法があります。

  1. オフサイトバックアップ

    • 通常、Cintas(私がよく知っているその分野の有名な会社)のような会社と契約して、バックアップテープを施設の1つに持って行きますが、従業員に毎日のバックアップを最後に家に持って帰らせるようなこともありますその日は何もないよりはましです。

  2. ある種のコロケーション施設。

    • データを格納する1つまたは複数のサーバーがある別の場所(データセンターなどの物理サイトまたはクラウドサービス)。

#2の利点は、災害時にビジネス継続性計画を立てることができることに加えて、#1でも使用できることです。バックアップシステムを(できればメインサイトにあるものに加えて)配置できるため、オフサイトバックアップがあり、メインサイトがダウンした場合、コロケーションサイトからサービスを実行できます(多くの場合、コスト削減が問題となる場合は、容量をいくらか減らします)。

どちらも特に安くはなく、耐火金庫の価格をはるかに超える可能性がありますが、長所は、あらゆるタイプのデータ損失に対する保護である耐火金庫から得ることができないものを提供することですが、耐火金庫は保護するだけです火に対して。

このためのビジネスケース/ベビーベッドの正当化は、基本的に「データを失うとどうなりますか?」という質問をすることです。答えは、ほとんどの場合、廃業することです。これにより、適切なバックアップスキームやコロケーション施設の必要性を担当者に説得するのはかなり簡単になります。(そして、私が働いたほとんどの場所には両方がありました。たとえそれが起こるまで、技術者が彼らのためにプッシュしたからです。)


4
または、私たちにほとんど起こった現実世界のイベント:サーバーを盗む誰か。(サーバーが次に取ったものであったときに物を置くためにスペースが
足りなかったよう

1
@LorenPechtelええ、私たちが持っていた最新の現実世界のイベントは、街のほとんどに権力を奪った30分間の異常な嵐でした。発電機が機能しなかったため、建物に電力が供給されている間に、4日間ほどコロ施設を使い果たしました。フェールオーバーサイトを作成することで優れた点がたくさんありますが、それはあなたが思っているよりもずっと頻繁に役立ちます。
HopelessN00b

5
絶対に。そして、このようなものがどのように展開されるかというスリリングなストーリーを聞きたい場合は、このSEポッドキャストエピソードを聞いてください。
ティムピエツッカー

4
耐火金庫は、ハードドライブの故障からあなたを救うことはありません。バックアップ用に特別に設計されたリモートサーバーの場所にデータを複製する必要があります。
aglassman

1
明確にするために、オフサイトでバックアップをとる人がいる場合、複数のオフサイトバックアップとローターが必要です。そうでなければ、fredが帰宅するまで、あなたの唯一の「オフサイト」バックアップは実際には毎日オフィスにあります。企業がこれを行うのを見てきましたが、それは怖いです。
Sirex

20

それらをAmazon glacierでバックアップします。頻繁にアクセスする必要のないもののための安価なストレージ。1か月あたり1 GBにつき1セントかかります。欠点として、障害が発生した場合にデータを取得するのは高価な場合があります。


2
-1。再構築に時間がかかるため、これは機能しない場合があります。
TomTomの

2
+1火災が発生した場合、とにかくデータセンターを再構築する必要があります。
mgjk

@mgjk本当に?これは小さなものです。
トムトム

6
Amazon Glacierを使用する前に、帯域幅料金を常に計算してデータを回復する必要があります。バックアップを実際に回復するのに物理的なバックアップソリューションに費やすよりも多くの費用がかかるのであれば、それほど大したことではありません。 Glacierに大量のデータがある場合、それは非常に適切です。
HopelessN00b

1
@TomTom OK、データクローゼットでオフィスを再構築する必要があります。会社がデータクローゼットに十分な大きさしかない場合でも、再構築にはまだ時間がかかります。
mgjk

9

データが重要な場合は、バックアップする必要があります。バックアップスキームには、テープへのバックアップといくつかのテープセットのオフサイトストレージを含める必要があります。

それを超えて、それはすべての詳細です...どのくらいのデータですか?どのくらいの頻度で変化しますか?どのような回復時間が必要ですか?

「ウェブキャストインベントリ」が頻繁に変更されない大きなファイルを意味する場合、テープへの定期的なバックアップは非常に簡単に思えます。


3
テープは、オフサイトのデータ保持要件を管理するための実証済みの真の方法ですが、特定の状況でテープが機能しない場合は、他にもさまざまな方法があります。
クリスS

2
ほとんどない。テープは依然として最も経済的で、低コストで安全です。他の建物へのマイクロ波リンクまたは何か「高帯域幅WAN」を除いて、広く使用可能な代替手段を認識していません。私はかつて、2つのデータセンターを建設する会社を知っていました。その間、すべての土地を所有し、そのために直接ファイバー接続を行っていました。
TomTomの

テープのメディアコストは確かに最も低くなります。
mc0e

4

72個のドライブのサイズについては実際には言及していませんが、本当に重要な場合は、少なくともリモートの場所にバックアップを作成する必要があります。メディア定格のファイヤーセーフは、現場のデータを保護するのに最適ですが、建物が完全に失われた場合はどうでしょう。のように、安全を含むすべてがなくなっています。オフサイトまたはオンラインバックアップの利用を開始する場合は、それらの建物/データセンターがあなたのものに十分近くないこと、両方が同時に破壊される可能性があることを確認してください。


3

あなたは想像する必要があります:私のデータの一部にアクセスできない場合はどうなりますか?通常、これは廃業を意味する可能性があります!(たとえば、失敗した小さな部分が、会社の運営に必要なコアデータではないという期待に頼ることはできません。)

おそらく必要になるでしょう:

  • データの冗長性(つまり、少なくとも2つの別々のディスクの山、またはディスク上のバージョンとテープ上の別のバージョン、またはそれらの組み合わせにデータがある)
  • 場所の冗長性(つまり、主な場所で火災/盗難/破壊行為/洪水/?が発生した場合に備えて、適切なオフサイトバックアップを用意します)

両方を組み合わせることができますが、通常、オフサイトは取得に時間がかかります(オフサイトのオフィスがある場合、または何らかの方法でアクセスする場合を除き、オフサイトのバックアッププロバイダーに確認してください)

冗長性の必要性について:

ハードドライブ(実際には、任意のストレージメディア)が古くなり、一部に欠陥があり、一部がぶつかります(たとえば、ドライバーを棚に置いたり別のドライブにぶつけたりすると、ディスクの表面を傷つけるのに十分なGが得られます)これにより、現在または短すぎて長すぎない時間枠内で障害が発生します)。つまり、バックアップメディア数日以内、数年以内に故障しますが、いつ故障するかはわかりません。

何かがいつうまくいかないかはわかりませんが、リスクを評価することはできます(正確な情報を得るためではなく、何がうまくいかないのか、冗長性と他の媒体への定期的な転送でそれを防ぐのが良い理由を知るため前のメディアが失敗する前):

同様のディスクがあり、2年以内に1が故障する確率は5%であると言えます

P(one disk fails within 2 years)=5%=0.05

P(that disk won't fail within 2 years)=0.95
P(you have n disk, 0 disk fails within 2 years)=(0.95)^n
P(at least 1 disk amongst n fails within 2 years)=1-(0.95)^n
 if n=72 (you have 72 disks), P=1-0.95^72=1-0,024894281=0,975...=more than 97% 

英語で:ディスクが72台あり、1つのディスクが2年以内に故障する確率が5%であると言える場合、2年以内にディスク故障が発生する可能性は97%以上になります。これはまったく正確ではありませんが、物事がうまくいかないことがあり、通常予想されるよりも速くなることを示しているはずです...

あなたをさらに「怖がらせる」ために、P(20年以内に1つのディスクが故障する)= 0.99と言うことができます(20年はドライブにとって長い時間です。それらを処理するため)

P(that disk won't fail within 20 years)=0.01
P(no disk amongst n fails within 20 years)=(0.01)^n=0
P(at least one disk amongst n fails within 20 years)=1-(0.01)^n=1=100% (or so close to 100% that it doesn't matter)

そして、これに加えて、同じベンダーですべてのドライブを購入すると、P(これらのディスクの1つが故障した後に故障する)は非常に高く、P(1つのディスクが故障する)よりもはるかに高くなります。 1つが失敗した場合、同じバッチ内の他の人がほぼ同時に失敗する可能性は高くなります(または非常に高くなります)。

だから私はお勧めします:

  • 少なくとも2つの別個のもの(2 x 72 hd、2つの別個のベンダーから?またはhdとテープ?)でバックアップします。
  • 少なくとも1つの(可能であれば、さらに別の)バックアップを別の町に保存します。これをn日ごと(少なくとも毎週)に更新して、プライマリストレージがすべて失敗した場合にバックアップ時間に戻ることができるようにします(つまり、プライマリストレージが失敗した場合に先週のデータに戻ることができます)今週)
  • チェックバックアップは定期的に(私は、意味ない少なくとも月に一度バイト当たり全部のバイトを読み、それらを確認してください。良い時間に、あまりにもまだ別のバックアップにメディアをコピーします。)
  • 少なくとも2人がこのことを知っており、外部バックアップが必要なときにデータを取得できるようにしてください。

1

@longneckの提案と似ていますが、わずかに異なります:Amazon S3またはGoogle Cloud Storageなどへのバックアップ(データのウォームバックアップを探している場合は、AmazonのGlacierを使用しないことをお勧めします。 Glacierからの高速データ復元。Glacierの検索料金の詳細については、Hacker Newsで素晴らしい議論があります。

Amazon S3の価格は、GBあたり0.095ドルです(以前はGBあたり0.125ドルでしたが、Amazonは1週間前に値下げしました)。GoogleのCloud Storageと他のサービスはおそらく同じ価格帯にあります。

コストと「無限に増大するストレージ」に加えて、きめ細かなACLとデータの許可も取得します。AmazonはACL制御用にIAMを提供していますが、他のプロバイダーも同様の制御を提供していると思われます。

最後に、これらのクラウドストレージサービスは、データの読み取り/書き込みやその他の操作を行うための非常に強力なAPIを提供します。これは、一部のバックアップタスクを自動化するのに役立つことがあります。


0

テープでボートをrowいでいない場合は、ディスクにバックアップしてみてください。

さらに2つのディスクアレイを購入し、ショックマウントのトラベルケースに取り付けます。ファイバのような多くの帯域幅を持つ何かを介してそれらを接続します。

それらをオンサイトで回転させ、それらにミラーリングし、安全な保管施設でオフサイトに保管します。

テープバックアップに似ていますが、データボリュームと1週間あたりのデータ生産量に応じてコストが高くなる可能性があります。


0

あなたの質問に対する別の代替案を提案したいと思います。必ず、オフサイトのバックアップが必要であるため、冗長性が得られます。Synologyと呼ばれる会社がNASタイプのドライブベイを見つけました。彼らは多くのバージョンのドライブベイを持っています。

最良の部分は、これらのドライブがオフサイトの場所であっても相互にRSYNCを実行でき、ブロックレベルのバックアップを実行できるため、不要なファイル全体ではなくファイルの変更のみをバックアップできることです。そのため、データは本質的に別の場所に複製され、バックアップにはかなりの時間と帯域幅が必要になります。DS1812 +は気に入っていますが、大規模な組織や高速なニーズに対応するドライブベイよりも高速なドライブベイを備えています。以下に会社のサイトへのリンクを貼り付けます。

http://www.synology.com/us/index.php

これがお役に立てば幸いです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.