問題を示すSMARTセクターの再割り当てはいくつですか?


17

私は1か月以上たっているNAS機器を持っています。ハードドライブのSMARTデータから生成されたアラートをメールで受け取るように構成されています。1日後、ハードドライブの1つが、セクターが悪化して再割り当てされたと報告しました。最初の1週間で、その数は問題のハードドライブの合計6セクターにまで上昇しました。1か月後、その数は再割り当てされた9つのセクターになります。レートは間違いなく減速しているようです。

NASはRAID-5構成で6台の1.5 TBドライブで構成されています。このような大容量ドライブでは、セクターが時々故障することが予想されるため、最初のいくつかのセクターがいつ移転するか心配していませんでした。しかし、他のどのディスクも問題を報告していないのは気になります。

再配置の割合、または再配置の総数で、ドライブの状態を心配する必要がありますか?これは、ドライブの容量によって異なる場合がありますか?


いいね、ジェレミー。ここで他の多くの人が役に立つと思うサーバーフォールトの最高の1つであり、答えを見つけるのは簡単ではありません。間違いなく+2以上に値する。質問を言い換えて、NetGearに固有のものではなく、一般的なストレージであるようにすることもできます
ユーザー名

フィードバックをありがとう、私はあなたが提案した変更を行い、状況を更新しました。
ジェレミー

1
再割り当てされた1つのセクターでドライブを交換します。ドライブの保証期間中はゼロになるはずです。メーカーは、これらのドライブの保証を常に尊重しています。
マイケルハンプトン

回答:


13

ドライブは、ほとんどのコンポーネントと同様に、バスタブ曲線の故障率があります。彼らは最初に多く失敗し、中間で比較的低い失敗率を持ち、そして彼らが彼らの人生の終わりに達すると多くの失敗をします。

ドライブ全体がこの曲線に従うように、ディスクの特定の領域もこの曲線に従います。ドライブの使用開始時に多くのセクターの再割り当てが表示されますが、これは徐々に減少します。ドライブが寿命の終わりに故障し始めると、ますます多くのセクターを失い始めます。

6を心配する必要はありません(ドライブによって異なります-メーカーに問い合わせてください)が、新しい再割り当ての頻度を確認する必要があります。劣化が加速するか、同じままである場合は、心配してください。それ以外の場合は、最初の慣らし期間の後は問題ないはずです。

-アダム


小さな点:ドライブはMTBFの前にLONGに失敗します。予想される寿命に近づくと、多くの失敗を意味すると思います。
エディ

5
グーグルは「バスタブ曲線」理論をかなり徹底的に明らかにしませんでしたか?
Insyte

20

この問題に関するGoogleの論文「大容量ディスクドライブの故障傾向」を再読すると、Adamの答えが間違っていると安全に言えると思います。ドライブの非常に大規模な人口の分析では、約9%がゼロ以外の再割り当てカウントを持ちました。伝える引用はこれです:

最初の再割り当て後、ドライブは再割り当てカウントのないドライブよりも60日以内に14倍以上故障する可能性が高いため、このパラメーターのクリティカルしきい値も1になります。

「オフライン再割り当て」を処理する場合はさらに興味深いものです。「オフライン再割り当て」は、実際に要求されたIO操作中ではなく、ドライブのバックグラウンドスクラブ中に発見された再割り当てです。彼らの結論:

最初のオフライン再割り当ての後、ドライブはオフライン再割り当てのないドライブよりも60日以内に21倍以上の障害の可能性があります。全体の再割り当てよりも劇的な効果です。

私の今後の方針は、ゼロ以外の再割り当てカウントを持つドライブの交換をスケジュールすることです。


それは面白いです、私はその論文を聞いていましたが、私はそれを再読する必要があるかもしれません。FWIW、NASの6つのドライブのうち4つがセクターを再割り当てしました。答えてくれてありがとう。
ジェレミー

3

異なるドライブには、おそらく異なるパラメーターがあります。あるベンダーの1TBエンタープライズシリーズのディスクであることを最後に確認したドライブには、再割り当て用に2048個の予約済みセクターがありました。

再割り当てされたセクターがゼロ以外の数であるドライブのSMARTレポートで、予約済みセクターの数を見積もることができます。以下の故障したドライブに関するレポートを検討してください。

...
ID# ATTRIBUTE_NAME          VALUE WORST THRESH TYPE      WHEN_FAILED  RAW
...          
  5 Reallocated_Sector_Ct   005   005   036    Pre-fail  FAILING_NOW  1955

ここでは、1955セクターである予約済み容量の95%が使用されています。したがって、初期容量は約2057でした。実際は2048であり、違いは丸め誤差によるものです。

再割り当てされたセクターの数が特定のしきい値に達すると、SMARTはドライブを障害状態に変えます。問題のドライブの場合、このしきい値は予約済み容量の64%に設定されます。それは約1310のリマップセクターです。

ただし、予約セクターは連続したスパンにありません。代わりに、それらはいくつかのグループに分割され、各グループはディスクの特定の部分からセクターを再マッピングするために使用されています。これは、データをディスク上の領域にローカルに保つために行われます。

ローカリティのマイナス面は、ディスクに多くの予約済みセクタがある場合があることです。ただし、1つの領域がすでに予約済みの容量を使い果たしている場合があります。この場合、動作はファームウェアに依存します。1台のドライブで、保護されなくなった部分でエラーが発生すると、FAILED状態になり、ブロックすることが確認されました。


「再割り当てのために2048の予約セクターがあった」とどのように判断しましたか?
AJ。

おそらく2047は、再割り当て可能なセクターの最大量です。私のドライブの1つは、「新しい」ためにeBayを購入したときにちょうど2047でした。これは0x7FFで、b11,111,111,111でもあります。2048に行くと余分なビットが無駄になります。
デビッド

2

ドライブがサポートしている場合は、SMARTロングセルフテストを実行することをお勧めします。これにより、ドライブのステータスに関する詳細情報が得られる場合があります。NASがこれを実行できず、数時間ドライブを引き出したりNASの電源を切ったりできる場合、ハードディスクを別のマシンに接続して長時間のセルフテストを実行できます。



1

メーカーによって、「許容可能な損失」の数値は異なります(モニターや不良ピクセルと同じ考えです)。ドライブの製造元に問い合わせて、標準が何であるかを確認してください。

しかし、それは悪い傾向のように見えます...


-1

Western Digitalは、TLERという名前のRAIDに配置されたディスクをフリーズする代わりに、許容可能な時間内に不良セクタを回復する技術に特に誇りを持っています(http://en.wikipedia.org/wiki/Time-Limited_Error_Recovery)。時間は通常5..7秒です。

私がウェブで見つけたように、無効なオプションのWDディスクドライブがありますが、一部の人々は安価なグリーンWDドライブでこの機能を有効にしてからRAIDに配置します。

WDTLERユーティリティはWDサポートサイトから削除されましたが、Google経由で簡単に発見できます。

PS私はこのユーティリティをステータスの読み取りにのみ使用し、今ではRAIDを使用していません:)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.