CentOSサーバーでハードディスクエラー/障害の兆候を確認する

14

CentOSでHDDエラーと障害の初期兆候をチェックする最良の方法は何ですか？

centos hard-drive corruption

— inac
ソース

1

チェックの頻度はどのくらいですか？毎日-毎週？

— inac

3

smartmon（http://sourceforge.net/apps/trac/smartmontools/wiki）をマシンにインストールすることをお勧めします。これは、ディスクの状態をチェックできるソフトウェアです。そうでなければ、/ var / log / messagesをチェックするか、 / var / log / syslogには、scsiエラーに関する言及があります。

— ポール
ソース

smartmonはそのように見えますが、その統計によると、故障したドライブの60％しかキャッチしません。..毎日スキャンするようにsmartmonを設定すると、実際にはhddがより速く死にますか？シーゲイト7200.10ですか？

— inac

@inac smartmonはhddsの高速化を支援しますか？これはどこで読みましたか？URLを追加してください。

— 030

2

dmesg

カーネルはI / Oデバイスに関する診断メッセージをログに記録するため、dmesgコマンドを使用してそれらのメッセージをチェックアウトできます。

— バンジャー
ソース

しかし、これを手動で実行するか、viにcronjob dmesgダンプを実行する必要がありますか？

— inac

どちらか。「dmesg> dmesg.dump.txt」でダンプするスクリプトを作成し、cronで毎日実行できます。

— バンジャー

1

デバイスでfsckを実行して、エラーをチェックできます。

— 落ち着いた
ソース

0

ポールが言うように、SMARTログはチェックするのに適した場所です。

BadBlocksを実行することもお勧めします。RAIDカードを持っている場合、その監視を使用する必要があるかもしれません。

— デントラシ
ソース

0

SMARTモニタリングは良い方法です。rootとしてsmartctl -a /dev/hda、hdaは必要なドライブです。hdb、sdaなどです。また、/ etc / aliasesのメールアドレスをrootのメールを取得するユーザーとして設定することをお勧めします。

しかし、それは非常にあいまいな答えです。大手メーカー（Dell、HPなど）で製造されたサーバーを使用している場合、利用可能な監視機能が向上している可能性があります。

— チャーン
ソース

0

パーティション/ dev / sda1（たとえば）の完全なチェックを試すことができます

fsck -f /dev/sda1

または、特定のパーティションの完全な書き込み読み取り非破壊検査を試してください

badblocks -vn /dev/sda1

— リーボ
ソース

/dev/sda1 is mounted; it's not safe to run badblocks!

— 030

e2fsck: Cannot continue, aborting.

— 030

@ 030メインディスクがマウントされていないランレベルにドロップします。

— -awiebe