「RAID 5 +スペア」または「RAID 6」を使用する必要がありますか?


12

RAID 5 +スペア」とは何ですか(ユーザーマニュアルのセクション4.17.2、P.54からの抜粋):

RAID5 + Spare:RAID 5 + SpareはRAID 5アレイで、ディスクが故障するとすぐにシステムを再構築するために1つのディスクがスペアとして使用されます(図79)。少なくとも4つのディスクが必要です。1台の物理ディスクに障害が発生した場合、データはパリティブロックから読み取られるため、利用可能なままになります。障害が発生したディスクのデータは、ホットスペアディスクに再構築されます。故障したディスクを交換すると、交換したディスクが新しいホットスペアになります。1つのディスクに障害が発生してもデータは失われませんが、システムがホットスペアにデータを再構築する前に2番目のディスクに障害が発生すると、アレイ内のすべてのデータが失われます。


「Raid 6」とは何ですか(ユーザーマニュアル、セクション4.17.2、P.54からの抜粋):

RAID6:RAID 6では、データはすべてのディスク(最小4つ)にストライプ化され、各データブロック(図80のpとq)の2つのパリティブロックが同じストライプに書き込まれます。1つの物理ディスクが故障した場合、故障したディスクのデータを交換用ディスクに再構築できます。このRAIDモードは、データ損失なしで最大2つのディスク障害をサポートできます。RAID 6は、障害が発生したディスクからのデータの再構築を高速化します。


「RAID 5 +スペア」と「RAID 6」はどちらも非常によく似ています...違いはわかりません。

「Raid 5 + Spare」はいつ最適ですか?

「レイド6」が最適なのはいつですか?

マニュアルは、5つの星の評価でさまざまなレイドを簡単に説明しています。「Raid 5 + Spare」は4つ星を獲得しますが、「Raid 6」は5つ星を獲得します。もしマニュアルを盲目的に信頼するなら、私は「レイド6」が常により良いと結論するでしょう。「Raid 6」は常に優れていますか?


1
ServerFaultはこれについて良い議論をしています。
ブライアン、

1
最終的に何をするにせよ、raidコントローラーでraidするだけで、moboに付属しているオンボードソフトコントローラーではできません。あなたのモボが消えたら、あなたはトラブルを求めています。
sound2man 2010年

raidはハードウェアコントローラーによってダウンしています(ソフトウェアraidコントローラーに対して非常に多くのことを聞いたことがあります)。
Trevor Boyd Smith、

回答:


17

要するに:

  • 安全性が主な関心事である場合は、RAID6を使用してください。RAID6は、同時に障害が発生した2つのドライブに耐えることができるためです。ドライブがR5 +スペア構成で故障した場合、スペアが速度が上がるまで別の故障から安全ではありません。これは、大きなドライブでかなり時間がかかる可能性があります(電源がオフになっているドライブでは前代未聞ではありません)スペアなどの年齢の場合、最終的に呼び出されたときにスピンアップに失敗します)。

  • パフォーマンスは王である場合は、5に行く+スペアアレイが劣化状態でないときに、書き込みパフォーマンスが良くなりますよう- R5とR6との性能差はR5と他のソリューションとの差よりもかなり小さいものの場合、あなたが持っています適切なコントローラー(つまり、部分的なブロック書き込み操作を行うと、ほとんどの場合、「読み取り-読み取り(-読み取り-読み取り)-パリティ」ではなく、「2-3同時読み取り、次にパリティ計算、次に2-3同時書き込み」 -calc-then-write-then-write(-then-write) "これは、一部の非常に安価なコントローラーとソフトウェアRAIDで実行できる処理です。

編集:私は最初に潜在的に重要なポイントを逃しました:

  • 電力消費が懸念される場合には、R5 +スペアには、余分な利点があります場合は、あなたのコントローラが必要になるまでパワーダウンスペアドライブを保持します。

最もよく書かれた/簡潔な。(各箇条書きの最初の2つの単語に明らかな長所/短所を記述します...非常に良いです)。
Trevor Boyd Smith、

データセンターやサーバールームなどの他のすべてのものと比較して、1台の追加ドライブの消費電力が実際に「懸念」されることがあるとしたら、知りたいと思います
warren

おそらく1台のマシンの1台のドライブ。しかし、X-amps-per-rackを取得し、超過分に対して多額を支払うコロロでは(または超過分は単に許可されない-場合によっては、行き過ぎると暗くなる)、目立つ可能性があります。「消費された」電力も二重の弱点です。それはノイズと熱に変換され、熱を移動させるためにより多くの電力が必要になります。ケージ全体またはキットのより大きなセットの場合、コンピューティングユニットあたりの追加ドライブの合計使用量は、十分にうるさい会計士が気付くかもしれない何かにすぐに加算されます。
デビッドスピレット

7

RAID 5 +ホットスペア:

  • 同等のコントローラハードウェアでは、RAID 6よりも優れたパフォーマンス
  • 同時に2つのディスクを失うことはできません。ディスクを紛失した場合、冗長性のない再構築時間(ホットスペアあり)があります。この時点で失敗したものはすべて完全な損失を引き起こします(すべてを優れたデータレスキュー会社に送って本当に$$$を支払うのではありません)

RAID 6:

  • RAID 5よりもパフォーマンスが悪い(コントローラーによって異なりますが、非常に目立つものから実質的に差がないものまでさまざまです)
  • 同時に2つのディスクを失う可能性があります

RAID 5または6の場合、同じ運用環境からのものではないディスクを使用するように注意する必要があります。再構築時に単一の障害が発生した後、ストレスの増大により次のディスクが障害を起こす可能性があります(私はそれを確認しました!)。同じ実行からのディスクは、まったく同じファームウェアを持ち、おそらく非常によく似た物理特性を持っています。

編集:何を選択するか

(これは、サーバーのパフォーマンス要件と許容可能なリスクにも依存します。)

サーバーの環境がハードウェア(コロ、気候など)に適している場合は、RAID5 +ホットスペアで問題ありません。

短時間で複数のディスクに障害が発生する可能性が高い環境(振動、湿度、汚れ)がある場合は、RAID 6を使用してください。

また、常に適切なバックアップとテストリカバリも行ってください。

編集2:まともなRAIDコントローラーには定期的にすべてのセクターを検証するスクラブがあります。


+1は、「適切なバックアップとテスト回復を行う」ことを意味します。それはだFIRST彼らはRAIDレベルの心配を開始する前に、誰もが持つべきもの。
ウォーレン2018年

3

RAID5は1つのパリティストライプを使用します。リードソロモンエラー訂正を計算し、RAID6の場合とRAID5の場合の2つのストライプを書き込む必要があります。RAID5は、RAID10のコストのためにストレージが巨大である強力なデータベースアプリケーションに使用されます。RAID5のコストは67%から94%まで変動し、RAID10が50%の場合はディスクの可用性が高くなります(ストレージコストがはるかに高くなります)。エラー訂正の計算とパリティビットの追加書き込み。

ドライブの平均故障間隔(MTBF)を使用すると、2つのドライブが次々に、または同時に故障する確率は、約(0.1% x 0.1%)*12または0.001 x 0.001 * 12です。1000台のドライブを実行している場合は、平均で年間最大1.2台のドライブが失われます。2台のドライブは、約8.3年ごとに次々と故障します。ここで、再構築中のドライブの負荷が大きいため、ドライブ障害はポアソン分布ではないため、この期間中に2番目のドライブの障害が発生する可能性が高くなり、分布はガンマ分布に近く、値が少し高くなります。障害が発生します。

結論として、RAID5のパフォーマンスは、書き込みおよびDBアプリケーションのRAID6より優れており、はるかに優れています。Webサーバーなどのほとんど読み取りアプリケーションの場合、違いはないため、RAID6を使用する必要があります。大容量ストレージの場合、RAID10よりもRAID5を使用することのコスト上のメリットは非常に大きくなります。オーバーヘッドを許容できる場合は、ディスク集中型のアプリケーションにはRAID10を使用してください。RAID10は常にパフォーマンスが向上します。

見逃された最大の収益はRAIDはバックアップではなく、冗長性を提供することでダウンタイムを制限する方法です。データが重要な場合は、バックアップする必要があります(そして回復プロセスをテストします)。

2 TBのSASドライブが10台あるRAIDアレイの1つに障害が発生した場合、回復に数千ドルのコストがかかり、回復が可能な場合でも回復に数週間かかります。

すべてのRAIDアレイが最終的に失敗します!


1

データの整合性の観点から厳密に言えば、そうです。失うものはまれですが、あなたは安全に、任意の2台のドライブを失うことができる2システムに深刻な物理的外傷の一緒に短いが。

経済的にはそれほどではありません。ホットスペアは、必要になるまで電源を切ることができます。つまり、電力を使用せず、摩耗はありません。

そしていつものように、RAIDは適切なオフサイトバックアップ計画の代わりにはなりません。


1

あなたは10を考えましたか?RAID 6に十分なディスクがある場合、10ボリュームを実行するのに十分です。ほとんどの場合、10の方が高速であり、冗長性があります(ディスク容量が多少犠牲になります)。


10は4つのディスクのみをサポートします。したがって、RAID 10はオプションのIMOではありません。
Trevor Boyd Smith、

1
@Trevor 10のサポートディスクの任意の偶数をRAID> = 4. RAID 6を行うことができた場合は、RAID 10行うことができます
ジョエルCoehoorn

1

これらの回答は理論上のドライブパフォーマンスのみに基づいているため、正しくないようです。1 GBのキャッシュを備えたRAIDコントローラーを使用している場合、書き込みは(通常は通常の負荷の下-いくつかの大規模な非通常の高負荷シナリオではなく)、ユーザーまたはアプリケーションの観点から即時に行われます-書き込みはメモリに移動し、 「実際の」書き込みは、ドライブのパフォーマンスで発生します。

ただし、同じデータが最近、または習慣的に既に読み込まれていない限り、読み取りを「偽造」することはできません(キャッシュで高速化)。RAID 6は読み取りに優れており、より耐性があります(2対1ドライブ)。RAID 5は書き込みが遅く、再構築時には本当に遅くなります。

そのため、実際の書き込みではRAID 5は遅くなりますが、RAIDは優れたRAIDコントローラで隠されます-ユーザー/アプリケーションの観点から、書き込みはメモリ内で発生します。ただし、RAID 5はRAID 6よりも読み取りが遅く、データが既に読み込まれていないか、アルゴリズムが繰り返し読み取りの記録を保持していない限り、コントローラーで改善されません。実生活では、レイド6が勝利します。

結論として、RAID 5の書き込みは低速ですが、優れたコントローラーによって非表示になっているため、RAID 5または6は、基本的には「認識される」書き込みパフォーマンスと同じになります(いくつか例外があります)。ただし、RAID 6は読み取り速度が速く、コントローラーは実際のワークロードで読み取りパフォーマンスを向上させるのに役立つとは考えられません。ここで、RAID 6は2つの失敗をとることができ、RAID 5 + 1は1つだけ失敗することを追加します。RAID6をより簡単に選択できるようになります。RAID5での再構築も非常に遅いことを忘れないでください。また、RAID 6ドライブが使用され(したがって、正しくテストされている)、故障したドライブはすぐに故障する傾向があることも学びました。アレイが30日以上稼働すると、それは数年続く傾向があります。ホットスペアはテストされておらず、実際には必要なときにすぐに故障する可能性があります。


0

これらは事件の事実であり、彼らは議論されていません(彼らが話していることを知っている人は誰でも):

  1. RAID5 + hotspareは、文字通り、ユーザーが選択できる最悪のRAID選択です。
  2. RAID10は、データを重視する場合(たとえば、ビジネスを継続するためにデータに依存することを意味する場合)のデフォルトの選択である必要があります。

考えられるすべてのRAIDオプションを検討する場合、主にRAID5 +ホットスペアがある場合、4つのドライブがあり、4つのドライブでRAID6を実行できることを意味するため、RAID5 +ホットスペアが最良の選択であるケースはありません。より良い、あなたはRAID10を行うことができます。

4つのドライブを使用すると、すべての選択肢(R5 + HS、R6、R10)から同じ使用可能なストレージが得られます。

目標がパフォーマンスである場合、RAID10はRAID5およびRAID6よりも優れています。

安全が目標である場合、RAID6またはRAID10は、ホットスペアの有無にかかわらずRAID5よりも優れています。どちらが安全かは議論の余地があります(6対10)。RAID6は2つのドライブ障害に耐えることができますが、回復不能な読み取りエラー(URE)が原因で、RAID6の1つのドライブ障害が原因でアレイ全体が停止する可能性もあります。

RAID10は、パリティベースではないため、UREに関して同じ問題はありません。パリティRAID(R5など)がドライブを失い、次にUREを検出すると、アレイ全体が失われます。RAID1またはRAID10では、ドライブが失われ、ミラーディスクでUREが検出された場合、読み取り不可能なセクターのみが失われます。

RAID5が可能な最悪の選択肢である理由の詳細な説明については、ここを参照してください。ドライブ数別の妥当なRAID選択のリストについては、こちらもご覧ください。(ホットスペアに関係なく)RAID5が最良の選択ではないことに注意してください。


2
同意しません。RAID5には用途があります。(たとえば、予算が厳しく、ディスクスペースが本当に必要な場合)。また、RAIDは1つのディスクに障害が発生してもバックアップに取って代わるものではないため、午後5時まで十分に対応できます。
ヘネス

「最良の選択」と「余裕のある最良の選択」の間には違いがあります。RAID5は、これまでで最高の選択肢ではありません。人々は最高の答えを得るためにここに来ます、そして人々はRAID5が常に最高のものより少ないことを知ってここを去るべきです。場合によってはRAID0の方がRAID5より信頼性が高いことが数学的に証明できます。これがRAID5の恐ろしさです。多くの場合、RAID5は午後5時に到達しない場合があります。RAID5に関しては、理論と現実の世界には大きな違いがあります。ここを
user1594322 '25 / 09/25

RAID10がUREと同じ問題を抱えていないのはなぜか、私にはまったくわかりません。4ドライブ構成のRAID10セットアップでは、1台のドライブを失い、対応するミラーでUREが発生した場合も同様に悩まされます。
ChrisInEdmonton 2013年

RAID10に故障したドライブがあり、残っているドライブにUREがある場合、アレイ全体ではなく、読み取り不可能なセクターのみが失われます。回答を更新しました。
user1594322 2013年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.