最近、私は展開したDrupalサイトのいくつかでダウンタイムに直面しています。サービスやサーバー自体を再起動してダウンタイムに対処するのではなく、積極的に問題にアプローチしたいと思います。サーバー/インフラストラクチャの状態を監視するためのnagios、munin、cactiなどの監視ツールについて読んだことがありますが、実際に運用環境で試したことはありません。私はほぼ99%の時間でDrupalを扱っていますが、サーバーレベルの監視とDrupal(アプリケーションコード)レベルの監視の両方の提案を見つけたいと思います。
基本的に、サーバーの負荷が高い場合、おそらく犯人(または被害者)を指していることを通知されるので、十分な情報に基づいた決定を下すことができます。また、PHPエラー/警告が発生したときに、Drupalレベルの監視(電子メールなど)に使用されるものを知りたいです。(メールサーバー自体がダウンするとどうなりますか?)