SSDドライブの正常性を判断する簡単な方法は?


13

ここに記載されているように、ZFSストレージアレイで2回「失敗」とマークされたIntel X-25Mドライブがあります。ただし、ドライブを取り外した後、他のコンピューター(Mac、PC、USBエンクロージャーなど)でマウント、読み取り、書き込みを行っているようです

ドライブの現在の状態を判断する良い方法はありますか?ZFSソリューションの以前の失敗は、バグ、悪いエラー報告、ハードウェアの収束であったと感じています。ただし、このドライブには寿命があるようです。


それはg1またはg2ですか?
ジムB

これはG2 120GB X25-Mドライブです。
ewwhite

回答:


12

ドライブの健全性をチェックする、しかし絶対的ではない良い方法は、SMART属性をチェックすることです。

以下は、smartctl v5.41 を使用して取得したIntel X25-M G2 160GBディスクのSMART属性セットです。(バージョンは重要であり、smartctlの以前のバージョンには異なる属性名マッピングがあり、実際にこのドライブの特定のテーブルを正しく理解していませんでした)。

# ./smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.18-194.32.1.el5] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED     RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4076
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       67
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148418
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       755
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       49
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       16956537
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

これは、ドライブに再割り当てされたセクターが1つあり、使用可能な予約済みスペースの1%(属性232)と予測されるプログラム/消去サイクルの2%(属性233)を使用したことを示します。148418 * 32MiB(属性225)が書き込まれています。

ドライブがかなりの数の再割り当てされたセクターを表示している場合、これはおそらく障害のあるフラッシュチップを指しているため、懸念の原因になる可能性があります(同様に、回転するディスク上のかなりの数の再割り当てされたセクターが表面エラー)。エンドツーエンドも悪いです-いくつかのX25-M G2 160GBディスクで、大規模(> 1000)のエンドツーエンドエラーレポートで障害が発生しました。ただし、これらのディスクには実際に2つの有用なエラー状態属性しかありません。通常のディスクに役立つSMART属性のほとんどはSSDには適用されないためです。

ただし、SMARTは一般に100%信頼できるとは見なされていません。Googleのディスク障害に関する調査では、さまざまなSMART早期警告インジケータとドライブ障害の間に良好な相関関係がありましたが、個々のドライブ障害を予測するための有用なツールではないことがわかりました。このため、私は通常、ドライブがまだ良いことを証明するのではなく、ドライブが悪いことを証明する方法としてSMARTを使用します(エラーが表示される場合、おそらくすぐに失敗するでしょう)。


1
Googleの調査はSMARTからの事前障害表示に集中していたことに注意してください。障害状態の報告は、多少正確です。
クリスS

2

「従来の」ハードドライブ用に作られていますが、「badblocks」ユーティリティは、ドライブ上のすべてのマッピング可能なセクターを実行することを目的としているため、ある程度の利点があります。SSDの断片化防止と内部再マッピングにより、ドライブが正常であることを確実に伝えることはできません。ただし、ドライブが不良であることが示された場合、ドライブをデッドとして確実に破棄します。


1

HD Tune(およびHD Tune Pro)は、SSDドライブの状態とパフォーマンスを測定するための優れたツールです。無料版(HD Tune)には非常に限られた機能セットがありますが、ヘルス分析がそれに含まれるため、運が良かったです。Proバージョンには15日間の試用期間があり、試してみることを強くお勧めします。SSDのパフォーマンスに関する優れた詳細な分析を提供します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.