平均故障間隔— SSD


32

この SSD の平均故障間隔(MTBF)は時間としてリストされます。1,500,000

それは多くの時間です。1,500,000時間はおおよそ170数年です。この特定のSSDの発明は戦後の戦争であるため、MTBFが何であるかをどのようにして知るのでしょうか?

私にとって意味のあるいくつかのオプション:

  • Neweggにはタイプミスがあります
  • 平均故障間隔の定義は、私が思うにそうではない
  • 彼らはMTBFが何であるかを推定するために、ある種の統計的外挿を使用しています

質問:

SSD / HDDの平均故障間隔(MTFB)はどのように取得されますか?


回答:


34

ドライブメーカーは、製品の信頼性を2つの関連する指標で指定しています。年間故障率(AFR)は、年間推定にスケーリングされたテストで故障した母集団のディスクドライブの割合です。および平均故障時間(MTTF)。

新製品のAFRは通常、加速寿命試験とストレス試験に基づいて、または以前の製品のフィールドデータに基づいて推定されます。MTTFは、年間の稼働時間数をAFRで割った値として推定されます。サーバー内のドライブの一般的な仮定は、100%の時間で電源がオンになっていることです。

http://www.cs.cmu.edu/~bianca/fast/

150万時間のMTTFは、やや妥当と思われます。

これはおおよそ、6か月間1000台のドライブを実行し、3台のドライブで障害が発生するテストです。
AFRは、毎年(2 * 6か月* 3)/(1000ドライブ)= 0.6%で、MTTF = 1yr / 0.6%= 1,460,967時間または167年です。

あなたは167台のドライブを持っているし、その年のメーカーの主張を実行し、それらを離れるときにその数を見て別の方法がある平均的に使用すると、1つのドライブに障害が発生し表示されます。

しかし、それは単に一定の「ランダムな」機械的/電子的故障率であると期待しています。

コメントで述べたように、故障率がバスタブ曲線に従うと仮定すると、メーカーのマーケティングチームは、例えばDOA's(到着時に死亡、品質管理に合格したがエンドユーザーが故障したユニットを含まない)それらをインストールします)、DOA定義を拡張して、初期障害の急増時のそれらも除外します。また、テストは十分に長く実行されないため、年齢の影響も見られません。

保証期間は、メーカーがSSDの実際の寿命をどれだけ予想しているかを示す良い指標だと思います!
それは間違いなく数十年または数世紀では測定されません...


MTBFに関連するのは、NANDセルがサポートできる書き込みサイクルの有限数に関連する信頼性です。一般的なメトリックは、通常はTB単位の合計書き込み容量です。他のパフォーマンス要件に加えて、それは1つの大きな制限事項です。

異なるメーカーと異なるサイズのサイズのドライブをより便利に比較できるようにするために、書き込み耐久性はディスク容量の一部として毎日の書き込み容量に変換されることがよくあります。

保証期間内であればドライブの寿命が保証されていると仮定すると
、100 GB SSDには3年間の保証と50 TBの書き込み容量があります。

        50 TB
---------------------  = 0.46 drive per day write capacity.
3 * 365 days * 100 GB

この数値が大きいほど、ディスクは書き込み集中型IOに適しています。
現時点(2014年末)で、サーバーラインSSDの価値は0.3-0.8ドライブ/日で、ミッドレンジは1-5から着実に増加しており、ハイエンドは書き込み耐久性レベルが最大25で急上昇しているようです* 3〜5年間の1日あたりのドライブ容量。

いくつかの現実世界のテストでは 、時々 、ベンダーの主張を大量に超えることができることを示しているが、ベンダーの限界を超えて機器の道をドライブする代わりに...常に企業の考慮事項ではない正しくspec'dドライブを購入し、あなたの目的のために。


1
AFRからMTTFへの変換では、一定のAFRが想定されることに注意してください。これは、可動部品(ハードドライブなど)を使用する場合には特に当てはまらず、SSDには当てはまらない場合があります。
マーク14年

絶対に本当。IIRCには、初期の障害の急増があり、その後障害が少ない期間があり、その後、年齢が上がるにつれてAFRが着実に増加します。変化する環境要因を追加すると、実際の数ははるかに高くなります。@Chris Sが述べたように、保証期間は、現実世界に有用な影響を与えるより良いメトリックであるかもしれません。
HBruijn

1'500'000時間のMTBFは本当に「このような1000のssdがある場合、6か月以内に3つが失敗する可能性が高い(それよりも早い場合もある)...」という冷静な見方です。+1(テストは短期間で行われるため、それらの寿命が保証を超えないことを期待してください。ドライブがN歳に達すると、おそらく「MTBF」は大幅に低下します)
オリビエデュラック

1
@HBruijn有益な回答をありがとう。言及している現象(初期障害のスパイク、低障害の期間、その後の障害の着実な増加)は、バスタブ曲線で表されます。
OSE 14年

19

残念ながら、MTBFはほとんどの人が考えるものではありません...

  • 個々のドライブの持続時間ではありません

    メーカーは、ドライブが保証期間中持続することを期待していますが、その後は実際には問題ではありません。古い電磁プラッタのハードドライブは、10年ほどで焼き付きます。集積回路の寿命は非常に長くなりますが、他のコンポーネント(特にコンデンサー)は、ある程度予測可能なサイクル数で摩耗します。

  • それはあるあなたは1つのドライブは、すべての時間を失敗することを期待する必要がありますどのようにこれらのドライブの多く。

    他の人が指摘しているように、製造業者は妥当な期間にわたってさまざまなテストを行い、故障率を決定します。これらの種類のテストにはかなりのばらつきがあり、マーケティングでは最終的な数値を「入力」することがよくあります。とにかく、1時間あたり1つの障害を平均化するために必要なドライブの数について、ベストエフォートで推測します。

    少ないドライブを搭載した状況で、あなたは、MTBFに基づいて、障害の統計的確率を推測することができますが、うまく設計された製品で障害が従うべきことを心に留めておく「バスタブ」曲線 -デバイスが最初にサービスにし、後に置かれたときに高い故障率をあります保証期間が終了し、その間の故障率は低くなりました。


2

それらは、小さなサンプルサイズと短い時間に基づいた統計的評価に基づいています。普遍的に合意された方法やプロセスはありませんので、それは本当にばかげた「マーケティング」です。

この記事では、もう少し説明するかもしれません。そして、ウィキペディアにはあなたが探しているものがあるかもしれないいくつかの式がありますか?

基本的に、ほぼすべて(食器洗浄機などの一般的な家庭用機械を含む)で、X個の製品がいくつかの時間実行されます。MTFBの計算には、この期間中に発生した障害の数が使用されます。

もちろん、製品のライフサイクル全体、つまりSSDを長時間にわたって実行することは不可能です。それらは、機械的な障害ではなく、書き込みの量によって主に制限されます(MTFBの目的です)


2

MTBFについての悪いニュースは、一般的な評価方法では、すべてのNANDセル間で書き込み負荷が均等に分散されることを想定していることです。ただし、セルはクラスターにグループ化され、1つのセルに障害が発生すると、クラスター全体が無効としてマークされ、予備の新しいセルと置き換えられます。通常、予約はSSDボリュームの約20%です。リザーブが使い果たされると、SSD全体がデッドとしてマークされます。

IRL SSDには、揮発性データだけでなく永続データも含まれています。SSDの90%が静的データで満たされ、残りの10%が書き込みの負荷が高い状態にあるとします。SSDコントローラーは、利用可能な空きクラスターに負荷を分散します。その10%は、予想よりも10倍速く寿命を使い果たします。彼らは最後まで何度も何度も保護区から置き換えられます。

永続的/揮発性データの量が30:1以上である非常に悪い場合、たとえば、写真の山や人気のあるWebサイトの比較的小さなデータベースでは、SSDは1年で死にます。

私の顧客の1人はSSDの特性に非常に感銘を受け、DBMSサーバーにそれらのペアを装備することを主張しました。次の12か月で、両方を2回交換しました。

しかし、それに応じてSSDのマーケティング資料の寿命は170年です。はい。


1

MTBFは、SSDドライブの耐久性の測定には関係ありません。SSDは、通常の回転HDDドライブのように時間自体ではなく、SSDセルの再書き込み回数に敏感だからです。SSDのより適切な指標は、1日あたりのドライブ書き込み(DWPD)です。たとえば、一部のエンタープライズクラスのSSDディスク3.2 TBの耐久性は5年間3 DWPDになります。

SSDベンダーは、(合計)テラバイト書き込み(TBW)または「書き込みサイクル」の観点で耐久性を提供する場合があります。

3.2Tb SSDドライブを使用した場合:
TBW = DriveSize * Years * DWPD;
TBW = 3.2TB * 5 * 365 * 3d = 17520 TB、5年間

ドライブが1秒あたり80
MByteの持続可能な書き込みスループットを提供する場合、WriteCycles = DWPD * Years;
WriteCycles = 3 * 365 * 5 =指定されたディスクの合計書き込みサイクル5475

ドライブに100%の使用率スループットを提供する場合、最悪のケースを計算していることに注意することが重要です(これはほとんど不可能です)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.