大規模なRAID-Zアレイは、大規模なRAID-5アレイと同じくらい悪いですか?


11

長い間(5TBを超える)RAID-5アレイが大きいという考えは、別のドライブに障害が発生するリスクが高いという理由だけで聞いていました。

RAID-Z1は、あらゆるサイズのアレイでこれを解決できましたか(4x2TBまたは5x2TBを考慮する必要がある場合)。すべてのドライブでそれほど激しくないデータを複製するより安全な方法でしょうか?

回答:


8

ここで他の答えの1つがレイアウトしたこと、つまりZFSは実際の使用済みブロックでのみ動作し、空きスペースではないことを考えても、はい、大きなRAIDZ1 vdevを作成することは依然として危険です。ほとんどのプールの使用率は少なくとも30〜50%で、多くは推奨最大値の80%に達しています(パフォーマンス上の理由から、いくつかはそれを超えないことを強くお勧めします)。使用済みブロックを使用することは大きなメリットではありません。また、他の答えのいくつかは、悪い読み取りが問題の原因であるように聞こえます。そうではありません。ブロック内の少しの腐敗は、ここであなたを台無しにするものではありません、通常、それは別のディスクが単に平らになって悪くなりますが、最初のディスクからの回復はまだ続いていますが、それはあなたを殺します。大きなraidz1では、日、さらには数週間かかることがあります 新しいディスクに再同期するので、その可能性は重要ではありません。

お客様への個人的な推奨事項は、多くの潜在的な不快感を避けるために、750 GBを超えるディスクでRAIDZ1(RAID5と同等)を使用しないことです。私は彼らが他の理由のためにこのルールを破ることで大丈夫でした(システムには他の場所にバックアップがあり、データはそれほど重要ではありませんなど)が、通常は大規模な最小オプションとしてRAIDZ2をプッシュするために最善を尽くしますディスク。

また、いくつかの理由から、通常、raidz2ストライプで8〜12個、またはraidz3ストライプで11〜15個を超えるディスクを使用しないことをお勧めします。3 TBのディスクでこれらの範囲のローエンドにいる必要があり、1 TBのディスクでこれらの範囲のハイエンドでも大丈夫かもしれません。これにより、リシルバーが行われている間、より多くのディスクが故障するという考えからあなたを遠ざけることができるのは、これらの理由の1つにすぎませんが、大きな理由です。

いくつかの健全な経験則を探している場合(15年4月10日編集-回転するディスクのみを念頭に置いてこれらのルールを作成しました。 SSDプールでもある程度意味がありますが、これらを書き留めたときに、すべてのSSDプールは私の頭の中ではありませんでした):

  • 750 GBを超えるディスクではraidz1をまったく使用しないでください。
  • raidz1で3未満または7を超えるディスクを使用しないでください。
  • 3ディスクraidz1 vdevの使用を考えている場合は、代わりに3方向ミラーvdevを真剣に検討してください。
  • raidz2で6枚未満または12枚以上のディスクを使用しないでください。
  • raidz3で7未満または15を超えるディスクを使用しないでください。
  • ディスクの数がIOPSを増加させる従来のRAIDアレイとは異なり、ZFSではVDEVの数であるため、ストライプvdevを短くするとプールIOPSの可能性が向上することを常に覚えておいてください。

ディスクのサイズとパフォーマンスが変化しても、同じ経験則をお勧めしますか?(2014)
ロード・ロー。

経験則のソースまたは動機はありますか?
ケニーエビット14

ソースは、Nexentaでの数千のZFS展開における私と同僚の経験です。更新については-ルールが立っています(04/10/15)、SSDを念頭に置いてこれらのルールを書いたとは言えませんが、箇条書きを編集したいという変更はありません。状況要因に応じて、SSDのルールは必ずしも同じではありません。HBAのボトルネックなど、その他の考慮事項もあります。
Nex7

1
@ Nex7、あなたのブログ記事でこれのロジックは何ですか?「8. RAIDZ-偶数/奇数のディスクカウント:raidz vdevのデータディスクの数を偶数に保つようにしてください(それほど難しくありません)」
Costin Gușă

ユースケースを覚えておくことは重要です。ここではserverfaultでプロフェッショナル/ビジネスアプリケーションに焦点を当てているので、あなたの答えは正解です。とはいえ、消費者向けのインストール(および、限られたビジネスアプリケーションでも)を実行している人は、アレイ内の1つのファイル(1つまたは複数)から1つのブロックを失うことがどれほど悪いか考えてください。再構築します。大きな問題ではない?その後、RAIDZ1で問題ない場合があります。
ダンプリッツ

11

RAID-ZはR5と同じくらい悪いですか?R1またはR10と同じくらい良いですか、通常はありません。

RAID-Zは、R5ではないドライブ上の空白スポットを認識します。そのため、RAID-Zはデータのある領域を読み取るだけで、失われたディスクを回復できます。また、データは必ずしもすべてのディスクにストライピングされるとは限りません。非常に小さなファイル単一のディスクに存在し、パリティが別のディスクに存在する場合があります。このため、RAID-5は、アレイで使用されるスペースとまったく同じ量のデータを読み取る必要があります(5TBアレイで1MBが使用される場合、再構築は1MBを読み取るだけで済みます)。

逆に言えば、大規模なアレイのほとんどがいっぱいの場合、ほとんどのデータをすべてのディスクから読み取る必要があります。R1またはR10と比較して、データを1台のディスクのみから取り出す必要があります(障害が発生したディスクごと。アレイがまだ回復可能な状況でのみ複数のディスクに障害が発生した場合)。

心配しているのは、すべてのセクターの読み取り操作で、正しく書き込まれていないか、読み取り不能になっているセクターを見つける可能性があるという事実です。最近の一般的なドライブの場合、約1x10 ^ -16です(すべてのドライブが同じというわけではありません。そのため、ドライブの仕様を調べて評価を計算してください)。これはめったにありませんが、1PBごとに約1回発生します。10TBアレイの場合、アレイが乾杯する可能性は1%であり、それを回復しようとするまでわかりません。

ZFSは、アレイの再構築を開始する前にほとんどの読み取り不能セクターが目立つため、この可能性を軽減するのにも役立ちます。ZFSアレイを定期的にスクラブする場合、スクラブ操作はこれらのエラーをピックアップし、それらを回避します(または、そのようにロールする場合はディスクを交換できるように警告します)。エンタープライズグレードのディスクを月に1〜4回スクラブすることをお勧めします。消費者グレードのドライブは、少なくとも週に1回以上です。


3

従来のRAID-5に対するRAID-Zの利点のいくつかは、特殊なハードウェアを必要とせず、RAID-5書き込みホールを回避することにより信頼性が高いことです。

ただし、RAID-ZとRAID-5の両方が複数のディスク障害に耐えることはできません。

ZFSを使用した2つのディスクの障害に耐えたい場合は、RAIDZ2と3つのディスクの障害RAIDZ3を使用できます。


1
+1また、ブロックごとのチェックサムにより、ZFSがアレイ内の破損を検出した場合、影響を受けるファイルを特定できます。ほとんどのR5 HBAは、破損シナリオとしてボリューム全体を破損としてマークするか、セクターが破損していることをOSに報告します。どちらの場合も、HBAは破損シナリオでどのディスクが間違っているかを知る方法がありません。
クリスS

ZFSの再同期化障害処理に関する詳細な議論:ZFSの無限再同期化
CVn
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.