VMware ESXi v4.1.0 348481を実行しているサーバーがあります。このサーバーには、ハードウェアRAID10とSATAバックアップドライブがあります。RAID10データストアにプライマリブートvmdkがあり、SATAバックアップドライブのデータストアに600 GBのvmdkがあるVMを実行しています。VMは、FreeBSDカーネルでDebian linuxを実行し、バックアップドライブにZFSを使用します。
編集:ドライブはVMに直接接続されていません。これはVMwareデータストアとして使用され、VMはSATAドライブのデータストアにvmdkを持っています。データストアがいっぱいではありません(65%のみがいっぱいです)
SSHを使用してサーバーにログインしたところ、昨夜のバックアップがハングしているzfs list
かzpool list
、両方がハングしていることがわかりました。そのため、ESXiで仮想コンソールを開いたところ、残念でした。
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
VMを再起動しようとすると、システムが再起動のためにダウンしているというメッセージが表示され、その後ハングしました。(^ Cは表示されますが、殺しませんshutdown
)。私は、割り込みまたはできないか、プロセス-私がしようとすると、何も起こりません。kill -9
zpool list
zfs list
rsync
- これは、バックアップSATAドライブが故障していることを示していますか?それともESXiエラーだけでしょうか?
- ドライブが故障しているかどうかは、vSphereクライアントでどのように確認できますか?何も表示されず、ハードウェアヘルスステータスの下のすべてが良好に見え、ストレージ構成の下には何も表示されませんでした。
- ここからどうすればいいですか?VMをハードリブートするだけですか?
更新: VMをハードリブートしました。オンラインに戻った後、バックアップzpoolはオンラインでしたが、
root@timestandstill:/home/jnet# zpool status -v
pool: backup
state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://www.sun.com/msg/ZFS-8000-8A
scrub: none requested
config:
NAME STATE READ WRITE CKSUM
backup ONLINE 0 0 0
da1 ONLINE 0 0 0
errors: Permanent errors have been detected in the following files:
/backups/someserver/home/someuser/public_html/somedir/calendar/someuser/calendars/somefile.ics
ドライブの交換に大きく傾いています...