7
サーバールームで何かが燃えています。どうすればそれがすぐに識別できますか?
先日、サーバールームからひどい燃えるような匂いがすることに気付きました。簡単に言えば、UPSユニットで燃え尽きるバッテリーモジュールの1つになりましたが、それを理解するまでに数時間かかりました。私たちがそれを理解できた主な理由は、UPSディスプレイが最終的にモジュールの交換が必要であることを示したことです。 ここに問題がありました:部屋全体が匂いで満たされていました。匂いがすべてに染み込んでいたので、においテストを行うのは非常に困難でした(言うまでもなく、私たちは頭がおかしくなりました)。臭いが最も強かったので、実稼働データベースサーバーをほぼ誤ってダウンさせました。重要な点は問題ないように見えました(CPU温度は60℃で、ファンの速度は問題ありませんでした)が、確信がありませんでした。たまたま燃えたバッテリーモジュールは、ラック上のサーバーとほぼ同じ高さで、わずか3フィートしか離れていませんでした。これが本当の緊急事態だったら、惨めに失敗していたでしょう。 現実的には、実際のサーバーハードウェアが燃焼する可能性は非常にまれであり、ほとんどの場合、UPSが原因であると考えています。しかし、複数の機器を備えた複数のラックを使用すると、すぐに推測ゲームになります。どの機器が実際に燃え尽きているのか、どのようにして迅速かつ正確に判断しますか?この質問は、部屋の大きさ、換気、場所などの環境変数に大きく依存することを理解していますが、どんな入力でも歓迎します。
454
hardware