監視サーバーをどのように監視しますか?


14

そのため、CentOSでGroundworks(Nagiosを使用)を実行して、さまざまなサーバーとプロセスを監視します。警告または重大な状態になったときに、電子メールとSMSテキストを自動的に送信するように設定しています。通常、これは完全に機能します。ただし、Postfixが電子メールの送信を停止することを決定したサーバーでPostfixに問題が2回発生しました。誰も気付かなかったため、最新の時間は4日間続きました。

それは重要な質問につながります。監視サーバーをどのように監視するのですか?


5
Quis custodiet ipsos custodes?
ジェームズL

へえ。ジュベナル。うまくプレイ。
organicveggie

ウォッチメンを見るのは誰?:D
フロランコートテイ

1
@organicveggie、監視サーバーはサーバーでもあります...監視サーバーを使用して監視サーバーを監視すると、どのような問題に直面しますか?
Pacerier

回答:


12

もちろん、2番目の監視サーバーを使用します。2番目の方法は、最初の方法を監視するだけで済むため、はるかに簡単になります。もちろん、メインの監視システムによって順番に監視する必要があります。

グループが、個別のITインフラストラクチャを備えた大規模な組織の一部である場合、別のグループの監視サービスが自分の監視サービスを監視できるように手配できる場合があります。

また、サーバーが毎日「大​​丈夫」メッセージを送信し、それを探す習慣を身に付けることもできます。(もちろん、日常的なメッセージに圧倒されていない場合にのみ効果的です。)


14

他の人は、物事は大丈夫だという定期的なメッセージを送ることを提案しますが、個人的に私はそれに同意しません。問題がない限り、監視はサイレントで行う必要があります。「ああ、私は数日中にその毎日の電子メールを受け取っていない」など、何かがおかしいことに気付かないようにしてください。特に、アラートに応答する人が複数いる場合、それぞれが毎日「I'm ok」メッセージをすでに削除していると考えるかもしれません。

監視サーバーのHTTPチェックを実行する外部サービス(数百ものがありますが、wormlyを使用します)があり、それが起動してインターネットに到達できることを確認します。それはそれを監視するための主な関心事です。その後、NagiosサーバーはすべてのクライアントNagiosサーバーを監視します。

しかし、あなたは良い点を持ち出します。私たちは、おそらく、HTTPのURLことを確認Postfixキューを追加する必要がありますし、それはおそらく、それが有することを意味するメッセージの異常な数、示した場合に任意のキューの中には、アラートを上げます。別のオプションは、現在使用しているSMTPと同様に、SMTP以外のSMS配信エージェントなど、さまざまなアラート方法を使用することです。

ただし、私たちの場合、メールサーバーが停止したことがあったことを思い出せません。もちろん、メールサーバーが使用するのはNagiosアラートの送信のみであるため、構成は非常に簡単で、ほとんど変更されません。


2
通常のOKメッセージはそれほど有用ではありません。刺激がない場合にアクションを実行するように人物を確実に調整することはできません。
ティムウィリスクロフト

@ティム:申し訳ありませんが、「刺激の欠如」は、予想される電子メールが受信されない状況を説明していません。このような場合、メッセージが届かない理由を調査するために「刺激」されると思います。しかし、それは私だけかもしれません。:)
スティーブン

1
私はあなたが彼らが意味すると思うものを意味しない心理学的用語を使って書いていると思います。行動心理学と航空心理学には、システムエンジニアに伝えるべきことがたくさんあります。第二次世界大戦では、18〜20歳の乗組員に最新の航空機をcrash落させることなく飛行させ、実際の軍事任務に注意を向けさせるために、この分野は大幅に開発されました。そのため、航空機には「大丈夫」なライトではなく、マスター警告ライトが付いています。TLDR(その言葉があなたがそれが意味することを意味するとは思わない)
ティムウィリスクロフト

1
私は、人間の注意を必要とするものがない限り、システムがノイズを発生させるべきではないという意見を非常に強く持っています。私たちには限られた注意があり、コンピューターは「I'm alive!」のような小さなブリップで簡単に私たちを圧倒できます。さらに、問題を示すものではないものは、物事を無視することを人々に思い込ませます。私は非常に一生懸命働いて、人間に何かが来たとき、それが本当に見なければならないものであることを確認します。私は彼が毎日レビューするあらゆる種類のログを持っている人と仕事をしています。もちろん、彼は...彼は昼食に出て行くことはできませんので、忙しいです
ショーンReifschneider

1
私は、サービスがあまりにも多くのメッセージを送信するべきではない、または人々がそれらをすぐに無視し始めることに同意する。ただし、監視システムが正しくセットアップされていれば、大量のメッセージが表示されることはありません。もちろん、Groundworks / Nagiosからのアラートの確認に関するポリシーがあります。このポリシーは、メッセージを一定期間効果的に停止します。長期にわたる停止の場合、システムまたはサービスの監視を無効にします。その結果、毎日の「I'm Alive」メッセージは実際にはかなり合理的です。
organicveggie

5

明らかに後置も監視する必要がありますが、それは別のトピックです;)

はFirefoxのNagiosチェッカープラグインを使用します。これは、定期的に使用するコンピューターのステータスバーで常に実行されています。

さらに、nagiosホストにpingを送信し、pingに応答しない場合にSMSを送信するカスタムスクリプトを外部ホストに持っています。

これまで(5年以上)正常に動作しました(木材をノック)。


2

サーバー監視(この場合はnagios)を監視するには、Pingdomまたはalertfoxの無料または基本的なプランが最適です。


良い提案。ただし、この場合、監視サーバーはファイアウォールの外側からアクセスできません。そのため、PingdomとAlertfoxは実際には機能しません。
organicveggie

1

最初に:1日1回または2回「I am a live」メッセージを送信します。次に、この目的のためだけに古いマシンを実行します。このマシンには、別のGSMモデム、小さなUPSなど、およびプライマリ監視サーバーへの専用(直接)接続があります。これは、ポイント3にも役立ちます。監視システムのステータスを定期的に確認してください。小さな補助監視システムは、私のオフィスのプライマリシステムのステータスページを常に表示します。


1

監視サーバーにインターネットからアクセスできる場合は、外部プロバイダー(websitepulseなど)で監視する必要があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.