SMARTCTLレポートからHDDがどれだけ死んでいるかを判断する方法


11

本日、開いているターミナルで「ハードドライブが故障しそうです」というランダムなレポートがありました。

私はいくつかのテストを行いましたが、これがどれほど悪いかわかりません。コンピューターは正常に動作していますが、先に進み、すべての作業をgithubにプッシュしました。クラッシュする可能性があり、すべてが失われる可能性がある場合、このコンピューターでの作業を継続したくありません。

ドライブはHDDです-Western Digital Caviar SE Serial ATA

安定したドライブの場合、通常のsmartctlはどのように見えますか?

SMART属性:

ここに画像の説明を入力してください

テストが失敗する:

ここに画像の説明を入力してください


あなたは本当にSSDについて話していますか?特に、Spin_Up_TimeSSDのコンテキストでは驚かされます。
mpy

ええ、明らかにそうではありません。当時、ドライブ文字は混乱していた。このマシンには5台以上のドライブが接続されており、すべて同じサイズです。
新しいオブジェクト

それに応じて質問を更新してください。その後、DavidPostillの回答も質問に適合します。
mpy

@mpy完了。デビッドの答えは、編集しなくても問題ないようです。
新しいObjekt

回答:


11

私はいくつかのテストを行いましたが、これがどれほど悪いかわかりません

短い答え:

このドライブをバックアップして、すぐに交換してください

長い答え:

Backblazeという会社が、ハードドライブの障害に関するデータを収集しました。会社のブログでそのデータを公開し、どのメーカーのドライブが他のドライブよりも頻繁に故障したかを強調しています。

最近のブログで、5つのSMART属性のうち、差し迫ったドライブ障害を示すものを正確に示すデータを公開しました。

経験から、次の5つのSMARTメトリックは、差し迫ったディスクドライブの障害を示しています。

  • SMART 5 – Reallocated_Sector_Count。
  • SMART 187 – Reported_Uncorrectable_Errors。
  • SMART 188 – Command_Timeout。
  • SMART 197 – Current_Pending_Sector_Count。
  • SMART 198 – Offline_Uncorrectable。

これらの5つの統計は、経験と業界の他のユーザーからの入力に基づいて選択しました。これは、これらの統計がメーカー全体で一貫しており、障害を予測する良い指標だからです。

この記事は次のことを示唆しています:

SMART 5: Reallocated_Sector_Count
1-4 keep an eye on it, more than 4 replace

SMART 187: Reported_Uncorrect
1 or more replace

SMART 188: Command_Timeout
1-13 keep an eye on it, more than 13 replace

SMART 197: Current_Pending_Sector_Count
1 or more replace

SMART 198: Offline_Uncorrectable
1 or more replace

ケース5(生の値2)、197(生の値484)、198(生の値371)が失敗の兆候を示しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.