ESXiでディスクに障害が発生しているかどうか、またはこれらのエラーの意味を確認するにはどうすればよいですか?


10

VMware ESXi v4.1.0 348481を実行しているサーバーがあります。このサーバーには、ハードウェアRAID10とSATAバックアップドライブがあります。RAID10データストアにプライマリブートvmdkがあり、SATAバックアップドライブのデータストアに600 GBのvmdkがあるVMを実行しています。VMは、FreeBSDカーネルでDebian linuxを実行し、バックアップドライブにZFSを使用します。

編集:ドライブはVMに直接接続されていません。これはVMwareデータストアとして使用され、VMはSATAドライブのデータストアにvmdkを持っています。データストアがいっぱいではありません(65%のみがいっぱいです)

SSHを使用してサーバーにログインしたところ、昨夜のバックアップがハングしているzfs listzpool list、両方がハングしていることがわかりました。そのため、ESXiで仮想コンソールを開いたところ、残念でした。

このスクリーンショットは私を悲しくします

(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)

VMを再起動しようとすると、システムが再起動のためにダウンしているというメッセージが表示され、その後ハングしました。(^ Cは表示されますが、殺しませんshutdown)。私は、割り込みまたはできないか、プロセス-私がしようとすると、何も起こりません。kill -9zpool list zfs listrsync

  1. これは、バックアップSATAドライブが故障していることを示していますか?それともESXiエラーだけでしょうか?
  2. ドライブが故障しているかどうかは、vSphereクライアントでどのように確認できますか?何も表示されず、ハードウェアヘルスステータスの下のすべてが良好に見え、ストレージ構成の下には何も表示されませんでした。
  3. ここからどうすればいいですか?VMをハードリブートするだけですか?

更新: VMをハードリブートしました。オンラインに戻った後、バックアップzpoolはオンラインでしたが、

root@timestandstill:/home/jnet# zpool status -v
  pool: backup
 state: ONLINE
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
   see: http://www.sun.com/msg/ZFS-8000-8A
 scrub: none requested
config:

        NAME        STATE     READ WRITE CKSUM
        backup      ONLINE       0     0     0
          da1       ONLINE       0     0     0


errors: Permanent errors have been detected in the following files:

        /backups/someserver/home/someuser/public_html/somedir/calendar/someuser/calendars/somefile.ics

ドライブの交換に大きく傾いています...

回答:


5

これらのエラーは確かに、SATAドライブの1つが、ブロック再割り当てスペースを使い果たすのに十分な不良ブロックを検出したことを示しています。そのドライブは不良であり、交換する必要があります。vSphereクライアントのどこに情報が表示されるのかわかりませんが、ログエントリはかなり明確です。

ご使用のハードウェアで可能であれば、ホットスワップが可能です。そうしないと、変更を実行するためにすべてをシャットダウンする必要があります。そのVMが30分後に自動的にシャットダウンしない場合は、ハードターミネーションを実行します。それは危険ですが、それが本当にハングしている場合、それのために多くはありません。


@ sysadmin1138に感謝します。したがって、これらのエラーはVM内で表示されますが、それは明らかに本当のハードウェアの問題を示していますか?IEは単なるVMwareの癖ではありませんか?
Josh

@ジョシュSATAドライブをVMに直接提示した場合、間違いなくそれがわかります。ファイルベースのストレージについては、確信が持てません。データストアの容量が不足している可能性があります。
sysadmin1138

私はそれを明確にすべきだった。これはファイルバックアップストレージです。データストアには十分なスペースがあります。1TBのドライブであり、VMDKは600 GBです。ディスクには他に何もありません。いずれにせよ、それは明らかに何かが間違っているので、誰かがこれが何であるかについての明確な説明を私に与えない限り、私はドライブを交換します。
Josh、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.