「大きな」レイド5アレイとは何ですか?


11

私のオフィスにあるバッファローTeraStation NASの最近の問題により、Raid 5を調査しました。

RAID 5を大規模アレイまたは大容量ディスクで使用することの不適性について話している記事をいくつか見つけました

これは、大規模なコンシューマドライブを備えたアレイの再構築に関する問題について説明する記事のです。

「大」と見なされるものを解決しようとしていますか?

ここにあるNASは4ドライブのRAID 5セットアップで、各ドライブは1 TBです。ドライブが故障し、交換されました。アレイは現在再構築中です。

このセットアップは、再構築中に問題が発生する可能性が高いという点で、大規模な構成ですか?

このセットアップは、日々の使用に対してどの程度信頼できますか?


2
通常のシステム負荷が与えられた場合、コントローラーが再構築にかかる時間はどれくらいですか?HDDのMTBFとは何ですか?これら2つの数値がある場合、RAIDの再構築中に2番目の(そして壊滅的な)障害が発生する可能性があります。HDDは再構築中に最もストレスがかかるため、上記の結果は二重障害の可能性を過小評価することに注意してください。
MadHatter

3
余談ですが、RAIDはバックアップではありませんよね?
cjc 14

5
@ cjc、SFのすべてのRAIDの質問に知恵の真珠を追加しますか、それともOPがRAIDがバックアップであると考えると思われますか?
BlueCompute

はい、私はそれを知っています。これはすべてバックアップされているので、raidアレイが適切に修復されなかったため、すべてを復元しなければならないという面倒が必要になりました。
ロブ

回答:


18

ディスクアレイの信頼性の設計:

  1. ドライブのUREレートを見つけます(メーカーはドライブの故障について話すのを好まないので、これを見つけるために掘り出さなければならない場合があります。Xは一般的に12-18前後です1/10 ^ Xでなければなりません)。
  2. ストレージのニーズに対する許容可能なリスク率を決定します†。通常、これは失敗の<0.5%の可能性ですが、「スクラッチ」ストレージでは数パーセントであり、重要なデータの場合は<0.1である可能性があります。
  3. 1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
    複数のパリティディスクまたはミラー内に複数のディスクのペアを持つミラーを持つ1アレイの場合、アレイ内のドライブの後にパリティ/ミラーを持つディスクの数に変更します。

そのため、アレイ内に4つの1TB WD Greenドライブのセットがあります。UREレートは1/10 ^ 14です。そして、それらをスクラッチストレージとして使用します。1 - (1 - 1TB x 1/10^14byte) ^ 3=> 3.3%1台のドライブが停止した後、アレイの再構築に失敗するリスク。これらは私のジャンクを保存するのに最適ですが、重要なデータをそこに置いていません。

†許容可能な故障の決定は、長く複雑なプロセスです。として要約できますBudget = Risk * Cost。そのため、障害の費用が100ドルで、発生する可能性が10%ある場合、それを防ぐために10ドルの予算が必要です。これにより、リスク、さまざまな障害のコスト、および潜在的な予防技術の性質を決定するタスクが大幅に簡素化されますが、アイデアは得られます。 [Data Drives] = [Total Drives] - [Parity Drives]。2つのディスクミラー(RAID1)とRAID5には1つのパリティドライブがあります。3つのディスクミラー(RAID1)とRAID6には2つのパリティドライブがあります。RAID1やカスタムスキームを使用してパリティドライブを増やすことは可能ですが、一般的ではありません。


ただし、この統計方程式には注意事項があります。

  • そのUREレートは公示されたレートであり、一般的に組立ラインからロールオフするほとんどのドライブで優れています。運がよければ、広告よりも桁違いに良いドライブを購入するかもしれません。同様に、乳児死亡率で死ぬドライブを得ることができます。
  • 製造ラインによっては不良な実行(実行中の多くのディスクが同時に障害を起こす)があるため、異なる製造バッチからディスクを取得すると、同時障害の可能性を分散するのに役立ちます。
  • 古いディスクは、再構築のストレス下で死ぬ可能性が高くなります。
  • 環境要因が犠牲になります:
    • ヒートサイクルされたディスクは、一般的に死ぬ可能性が高くなります(たとえば、定期的に電源をオン/オフします)。
    • 振動はあらゆる種類の問題を引き起こす可能性があります。ディスクアレイで叫んでいるITの YouTubeのビデオを参照してください。
  • 「嘘には3種類あります。嘘、ひどい嘘、統計です」-ベンジャミン・ディズレーリ

デバイスから取り出したドライブは、Samsung HD103SI 1TBドライブです。残りの3つのドライブは同じだと思います。交換用のドライブは別のメーカーのものです。詳細はわかりません。
ロブ14

このドライブの速度は、これに応じて1月10日^ 15であると思われる: - comx-computers.co.za/HD103SI-specifications-28474.htm
ロブ・

1
方程式を修正しましたが、例は正しかったのですが、今は両方とも正解です。配列は1-(1-1099511627776*0.000000000000001)^3=> 0.00329になります。^3内側にあるはずの場所の外側にブラケットがあります。そして、その1/10 ^ 15にはもう1つゼロがあるはずです。
クリスS 14

2
1TBドライブは1000000000000バイトになるので、UREレートに応じて3%| 0.3%未満になります。
user9517 14

1
@IanRingroseこれは統計的に有効です。私はすでにあなたの特定の懸念に対処しました。すでに述べられていること以外に、追加することに関連するものはありますか?
クリスS 14

9

この記事が存在する理由は、HDDの回復不能なビットエラーレートに注意を引くためです。具体的には、安価な「ホームPC」ディスク。通常、工場仕様は1/10 ^ 14です。これは約12.5TBのデータであり、2TBのディスクでRAID-5を実行している場合、非常に迅速にヒットします。

つまり、次のいずれかを行う必要があります。

  • より小さなRAIDグループを使用し、より多くの無駄なスペースを受け入れます。
  • RAID-6を使用して、追加の書き込みペナルティを受け入れます。(RAID5より50%高い)
  • より高価なディスクを購入する-「サーバーグレード」のUBER仕様は1/10 ^ 16であるため、これは重要なポイントです。(1.2PBは12.5TBよりも優れています)

通常、RAID-6が一般的な方法であることをお勧めしますが、パフォーマンスが低下します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.