大きなクラスターでNagiosの依存関係を管理する方法は?


8

私は依存関係のない非常に大きなnagios構成(約4000サービス)を使用しています。これにより、何か問題が発生したときに大量の通知が発生します。

Nagios Dependenciesを使用してベストプラクティスを探しますが、Webで見つけたのは、1つの例を使用した基本的な理解だけです。私が必要としているのは、より深い情報、そのような設定ファイルを管理する方法のベストプラクティスです。

例:Apacheサーバーがそれぞれリッスンしている100台のサーバーのクラスターで、Apacheプロセスの数とリッスンするTCPポート80を監視しています。一方をもう一方に依存させたいのですが、dependent_hostgroup_nameはそのトリックを実行しませんすべての「チェックプロセス」サービスは、各「check_http」サービスに依存します。

質問は次のとおりです。依存関係をどのように管理しますか?スクリプトを使用して生成しますか?


1
この男は、同じ問題を抱えている:dimmeria.com/node/1804は 、スクリプト/テンプレートが唯一の方法であるように私には思える:(私は私がする必要はありませんので、誰かが私の前にそれをやった願っています。
ファルケン

回答:


2

スクリプトなしで行うのはかなり難しいことに同意しました。

すべてのサービスチェックコマンドについて、通常依存するものを(dbテーブルに)定義しました。これにより、すべてのサービスの依存関係を手動で構成する必要がなくなります。ホストの依存関係は手動で行っていますが、スクリプトを介してスイッチでMACアドレスの検出を行うと、自動化に役立ちます。

例:

「check_http_content」は「check_ping」に依存する「check_http」に依存します。
「check_cisco_ifstate」は「check_ping」に依存する「check_snmp_ok」に依存します

スクリプトを使用してデータベースから設定を構築する場合、これは実装するのが難しくありません。そうでない場合は、パーサーを作成して構成ファイルを確認し、ルールに基づいて依存関係を挿入します。

構成を構築するための構成データベースがなければ、かなりのnagios実装を想像することはできません。これにより、nagiosが欠落している場合に独自の抽象化を追加でき、他の多くの点で生活がシンプルになります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.