ECCチップキルエラー:どのDIMMですか?
多くの場合、サーバーのDIMMが不良になり、syslogに次のエラーが表示されます。 5月7日09:15:31 nolcgi303カーネル:EDAC k8 MC0:一般的なバスエラー:参加プロセッサ(ローカルノード応答)、タイムアウト(タイムアウトなし)メモリトランザクションタイプ(汎用読み取り)、memまたはi / o(memアクセス) 、キャッシュレベル(汎用) 5月7日09:15:31 nolcgi303カーネル:MC0:CEページ0xa0、オフセット0x40、粒度8、シンドローム0xb50d、行2、チャネル0、ラベル "":k8_edac 5月7日09:15:31 nolcgi303カーネル:MC0:CE-利用可能な情報なし:k8_edacエラーオーバーフローセット 5月7日09:15:31 nolcgi303カーネル:EDAC k8 MC0:拡張エラーコード:ECCチップキルx4エラー HP SmartStart CDを使用して、エラーが発生しているDIMMを特定できますが、その場合はサーバーの稼働を停止する必要があります。サーバーが稼働しているときにどのDIMMが破綻するかを理解するための賢い方法はありますか?すべてのサーバーは、RHEL 5を実行するHPハードウェアです。