そのため、CentOSでGroundworks(Nagiosを使用)を実行して、さまざまなサーバーとプロセスを監視します。警告または重大な状態になったときに、電子メールとSMSテキストを自動的に送信するように設定しています。通常、これは完全に機能します。ただし、Postfixが電子メールの送信を停止することを決定したサーバーでPostfixに問題が2回発生しました。誰も気付かなかったため、最新の時間は4日間続きました。
それは重要な質問につながります。監視サーバーをどのように監視するのですか?
そのため、CentOSでGroundworks(Nagiosを使用)を実行して、さまざまなサーバーとプロセスを監視します。警告または重大な状態になったときに、電子メールとSMSテキストを自動的に送信するように設定しています。通常、これは完全に機能します。ただし、Postfixが電子メールの送信を停止することを決定したサーバーでPostfixに問題が2回発生しました。誰も気付かなかったため、最新の時間は4日間続きました。
それは重要な質問につながります。監視サーバーをどのように監視するのですか?
回答:
他の人は、物事は大丈夫だという定期的なメッセージを送ることを提案しますが、個人的に私はそれに同意しません。問題がない限り、監視はサイレントで行う必要があります。「ああ、私は数日中にその毎日の電子メールを受け取っていない」など、何かがおかしいことに気付かないようにしてください。特に、アラートに応答する人が複数いる場合、それぞれが毎日「I'm ok」メッセージをすでに削除していると考えるかもしれません。
監視サーバーのHTTPチェックを実行する外部サービス(数百ものがありますが、wormlyを使用します)があり、それが起動してインターネットに到達できることを確認します。それはそれを監視するための主な関心事です。その後、NagiosサーバーはすべてのクライアントNagiosサーバーを監視します。
しかし、あなたは良い点を持ち出します。私たちは、おそらく、HTTPのURLことを確認Postfixキューを追加する必要がありますし、それはおそらく、それが有することを意味するメッセージの異常な数、示した場合に任意のキューの中には、アラートを上げます。別のオプションは、現在使用しているSMTPと同様に、SMTP以外のSMS配信エージェントなど、さまざまなアラート方法を使用することです。
ただし、私たちの場合、メールサーバーが停止したことがあったことを思い出せません。もちろん、メールサーバーが使用するのはNagiosアラートの送信のみであるため、構成は非常に簡単で、ほとんど変更されません。
明らかに後置も監視する必要がありますが、それは別のトピックです;)
私はFirefoxのNagiosチェッカープラグインを使用します。これは、定期的に使用するコンピューターのステータスバーで常に実行されています。
さらに、nagiosホストにpingを送信し、pingに応答しない場合にSMSを送信するカスタムスクリプトを外部ホストに持っています。
これまで(5年以上)正常に動作しました(木材をノック)。
サーバー監視(この場合はnagios)を監視するには、Pingdomまたはalertfoxの無料または基本的なプランが最適です。