CentOSサーバーでハードディスクエラー/障害の兆候を確認する


14

CentOSでHDDエラーと障害の初期兆候をチェックする最良の方法は何ですか?


1
チェックの頻度はどのくらいですか?毎日-毎週?
inac

回答:


3

smartmon(http://sourceforge.net/apps/trac/smartmontools/wiki)をマシンにインストールすることをお勧めします。これは、ディスクの状態をチェックできるソフトウェアです。そうでなければ、/ var / log / messagesをチェックするか、 / var / log / syslogには、scsiエラーに関する言及があります。


smartmonはそのように見えますが、その統計によると、故障したドライブの60%しかキャッチしません。..毎日スキャンするようにsmartmonを設定すると、実際にはhddがより速く死にますか?シーゲイト7200.10ですか?
inac

@inac smartmonはhddsの高速化を支援しますか?これはどこで読みましたか?URLを追加してください。
030

2
dmesg

カーネルはI / Oデバイスに関する診断メッセージをログに記録するため、dmesgコマンドを使用してそれらのメッセージをチェックアウトできます。


しかし、これを手動で実行するか、viにcronjob dmesgダンプを実行する必要がありますか?
inac

どちらか。「dmesg> dmesg.dump.txt」でダンプするスクリプトを作成し、cronで毎日実行できます。
バンジャー


0

ポールが言うように、SMARTログはチェックするのに適した場所です。

BadBlocksを実行することもお勧めします。RAIDカードを持っている場合、その監視を使用する必要があるかもしれません。


0

SMARTモニタリングは良い方法です。rootとしてsmartctl -a /dev/hda、hdaは必要なドライブです。hdb、sdaなどです。また、/ etc / aliasesのメールアドレスをrootのメールを取得するユーザーとして設定することをお勧めします。

しかし、それは非常にあいまいな答えです。大手メーカー(Dell、HPなど)で製造されたサーバーを使用している場合、利用可能な監視機能が向上している可能性があります。


0

パーティション/ dev / sda1(たとえば)の完全なチェックを試すことができます

fsck -f /dev/sda1

または、特定のパーティションの完全な書き込み読み取り非破壊検査を試してください

badblocks -vn /dev/sda1

/dev/sda1 is mounted; it's not safe to run badblocks!
030

e2fsck: Cannot continue, aborting.
030

@ 030メインディスクがマウントされていないランレベルにドロップします。
-awiebe
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.