HDD SMART結果をどのように解釈しますか?


58

最近、私のラップトップは少し信頼性が低くなり始め、何らかの理由で、HDDが故障し始めているのではないかと疑い始めました。インターネットで少し探した後、システムメニューでUbuntuのディスクユーティリティを見つけ、これから長いSMART診断を実行しました。

ただし、ディスクユーティリティのドキュメントは非常に貧弱(palimpsest?)であるため、結果の解釈方法がわかりません。

読み取りエラー率が5,000万を超える値ですが、テストは良好ですか?!

たとえば、読み取りエラー率は5,000万(!)を超えていますが、評価の評価は「良好」です。

これらのテストの結果(特に、正規化、最悪、しきい値、値の数値)を解釈する方法を説明してくれる人がいますか?そして、私のHDDで得た結果について彼らがどう思うか教えてください。(ありがとう)


「ハードウェアECCの回復」は「読み取りエラー率」と同じ値ですか?私のディスクには676の電源サイクルがあり、285日間電源が投入され、193Mのエラーがあります。私のディスクと比較すると、ディスクのエラーは大きすぎますが、ここでは推測しています。とにかく私はちょうど
oOを

イップ-両方の数字は同じです!
マーティ

回答:


54

ウィキペディアで SMARTがどのように機能するかについての適切な説明があります。しかし、簡単な紹介:

  • 値:これは、コントローラーが報告する生の値です。通常、それは理解しやすい値(時間単位の電力や温度など)ですが、そうでない場合もあります(読み取りエラー率など)。メーカーによって、このデータに異なる構造と意味を使用できます。

  • 正規化:これは正規化された上記の値であるため、値が大きいほど常に優れています。したがって、読み取り/エラー率の114は113よりも優れています。ここでも、ハードドライブが未加工データを正規化された値に変換する方法はベンダー固有です。

  • 最悪:ドライブが過去に持っていた最悪の正規化された値(99はおそらく工場出荷時設定です)。

  • しきい値:正規化された値がこの値より低い場合、ドライブが故障する可能性があります。

ハードディスクは大丈夫のようです。読み取りエラー率の値は、ドライブが故障した回数ではなく、ディスクの製造元に依存する一部のデータ構造です。


特定のドライブが正規化された値を報告していない場合、最悪しきい値が用語で報告されることを意味しますか、またはすべてのドライブが正規化された値を使用し、一部のユーザーのみがそれらを「値」としてラベル付けすることを選択しますか?
DeveloperACE

25

はい、通常、読み取りエラー率の生の値はナンセンスです。監視したい値は、再割り当てされたセクター数、保留中の数、および修正不可能なオフラインです。それらは、修正されていない、修正されていない、または修正されていない不良セクタの数であり、そこにある生の値は一般に意味があり、セクタの数です。

セクターの読み取りに失敗すると、保留になります。次回そのセクターに書き込もうとすると、ドライブはそれを書き直そうとします。それが機能する場合、すべてが正常に戻ります。セクタを正しく書き込めない場合、スペアプールからセクタを再割り当てします。それができない場合(おそらく予備プールを使い果たしている可能性がありますか?)、それはちょうどoffline_uncorrectableになり、読み取りまたは書き込みを試みるとエラーになります。


1
私は、生の読み取りエラー率にほとんど失敗しているドライブを持っています。テストは、ドライブがしばらく(おそらく15分)実行された後にのみ失敗します。Windowsでは、ドライブへのアクセスがプロセスをハングさせるという症状がありますので、Ubuntuツールを使用して何が間違っているのかを判断していますが、読み取りエラー率が原因でドライブが間違っていると言っていることについては迷っていますtは、ドライブのあらゆる種類の差し迫った障害を示しているようですが、ドライブには間違いなく問題があります!
マイケル

また、テスト結果自体があいまいであることも付け加えてください。全体的なテストでは失敗したと言われていますが、読み取りエラー率テストは、ばかげた値(100/100、最悪、正規化)を持っているにもかかわらず、「OK」と言います。
マイケル

9

psusiはそれを打ちます。

seagate.comでデータシート(ホワイトペーパー)を読むと、HDDがどのように作成され、テストされ、実際に機能するかがわかります。完璧なHDDはありません。昔は、新しいドライブボックスに入った紙のリストからHDDコントローラーに不良セクターを入力する必要があったため、コントローラーはそれらをスキップしました。

最新のドライブにはエラー修正機能があります。初日からセクターは悪いです。

したがって、彼らはそれらをマッピングします。これは、ドライブが不良セクタをスキップすることを意味します。実際、それらは「論理的にスワップアウト」されています-不良セクターは、新しい良好なスペアシリンダーセクターにマッピングされます(スペアシリンダーがあります-シリンダーをトラックと考えてください)。これは、SMART utilを除いて、外界に対してすべて透過的です。

各メーカーは好きなようにできるので、ドライブが製造されるとすぐに10個の不良セクタがある場合でも、エラーカウントをゼロに設定する人もいます。

ドライブのファームウェアには3回のルールがあります-セクターを3回読み取り、3回すべてが不良である場合、その場で「再調整」を実行し、さらに3回読み取ります。それでもドライブが正常でない場合は、そのセクターをスペアセクターの1つにマップします。これはファームウェアの奥深くにありますが、バックグラウンドで継続的に発生し、すべてユーザーに対して透過的です。

製造業者は、3回の不正な読み取りがある場合、またはキャリブレーションがそれらに任せられた後、生のエラーを報告することを選択するかどうか。彼が上記で述べたように、同じ種類のドライブがたくさんあり、奇妙な傾向が見られない限り、それは重要ではありません。

ポイント2:すべてのHDDには自然な読み取りエラーがあります。必要に応じて、Seagateでも学習できます。しかし、それらはすべてその場でエラーが発生します。再度読み取られ、通常はCRCエラーのテストに合格します。そうでない場合、DRIVEはそれをスワップアウトしようとします。ディスクをクールに実行すると、ディスクが長時間持続し、多くのユーザーがスペアシリンダーを使い果たすことはありません。しかし、psusiがあなたに言うようにそれを見てください!

私はこれを、これまでに作った最初の1GB HDDの1つを実行している古いPCでタイプしています。そしてまだ良いです。(バックアップ済み)(冷却の不足はありません...)熱が一番のキラーであり、電力サージです。UPSを実行します。乾杯と良い一日。これがお役に立てば幸いです。(これまでにDatA Generalのハードディスクのクラッシュを見たことがありますか?かつては膨大な量のアルミニウムウール、巻き毛の手がかりで部屋を満たしていましたか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.