さまざまなRAIDシステムの信頼性を、コンシューマ(URE /ビット= 1e-14)またはエンタープライズ(URE /ビット= 1e-15)ドライブと比較したい。再構築が成功する確率を得る公式は(機械的な問題を無視し、後で考慮します)単純です:
error_probability = 1-(1-per_bit_error_rate)^ bit_read
覚えておくべき重要なことは、これは少なくとも1つのUREを取得する確率であり、必ずしも1つだけではないということです。
6 TBの使用可能なスペースが必要だとします。以下で取得できます:
各6 TBの1 + 1ディスクを備えたRAID1。再構築中に、6TBのディスクを1つ読み戻します。リスクは、1-(1-1e-14)^(6e12 * 8)=民生用の38%またはエンタープライズドライブ用の4.7%です。
各3 TBの2 + 2ディスクを備えたRAID10。再構築中に、3TBのディスクを1つだけ(バックは故障したディスクとペアになっています!)読み取り、リスクは低くなります。エンタープライズドライブ。
それぞれ3TBの2 + 1ディスクを備えたRAID5 / RAID Z1。再構築中に、それぞれ3TBの2つのディスクを読み戻します。リスクは、1-(1-1e-14)^(2 * 3e12 * 8)=コンシューマの場合38%、または4.7%またはエンタープライズドライブです。
各2 TBの3 + 1ディスクを備えたRAID5 / RAID Z1(SynologyなどのSOHO製品のユーザーがよく使用します)。再構築中に、それぞれ2TBの3つのディスクを読み戻します。リスクは、1-(1-1e-14)^(3 * 2e12 * 8)= 38%のコンシューマーまたは4.7%またはエンタープライズドライブです。
単一のディスクトレランスのエラーの計算は簡単ですが、複数のディスク障害(RAID6 / Z2、RAIDZ3)に耐えられるシステムでの確率の計算はさらに困難です。
最初のディスクのみが再構築に使用され、2番目のディスクがケースまたはUREで最初から再度読み取られる場合、エラー確率は上記の平方根で計算されたものです(コンシューマRAID5 2 + 1では14.5%、コンシューマでは4.5% RAID1 1 + 2)。ただし、(少なくとも完全なチェックサムを持つZFSでは!)2番目のパリティ/利用可能なディスクは必要な場所でのみ読み取られると仮定します。つまり、必要なセクターはわずかです:最初のディスクでUREがいくつ発生する可能性がありますか?そうでないと、シングルディスクトレランスシステムのエラー確率が、私が計算したよりもさらに急上昇します。
私が正しければ、2番目のパリティディスクは、非常に低い値へのリスクを実質的に低下させます。
質問はともかく、製造業者はマーケティング上の理由で消費者クラスのドライブのURE確率を高めることに注意することが重要です(より多くのエンタープライズクラスのドライブを販売)、したがって消費者クラスのHDDでさえ1E-15 URE /ビット読み取りを達成することが期待されます。
一部のデータ:http : //www.high-rely.com/hr_66/blog/why-raid-5-stops-working-in-2009-not/
したがって、かっこ(エンタープライズドライブ)で指定した値は、コンシューマードライブにも現実的に適用されます。また、実際のエンタープライズドライブはさらに高い信頼性を備えています(URE / bit = 1e-16)。
機械的な故障の可能性に関して、それらはディスクの数に比例し、再構築に必要な時間に比例します。