サーバー管理者 nagios

2

nagiosスクリプトを書く途中で、SSHに悩まされています。 manページによると： -q Quiet mode. Causes all warning and diagnostic messages to be suppressed. それでも、quietフラグを有効にしてから無効なポートを渡すと、エラーが発生します。 $ ssh user@localhost -q -p test Bad port 'test' これは問題です。というのも、それによってそのメッセージが最初の行になり、Nagiosがそれをつかむからです。!= 0sshから終了コードを取得した後、「警告| SSHエラー」のようなものを出力する必要がありますが、出力できる最初の行は2行目です。 SSH TRULYを静かにするにはどうすればよいですか？注：この質問をserverfault、スーパーユーザー、またはstackoverflowに投稿するかどうかはわかりませんでした。ユーザーベースはおそらくcli SSHとcliスクリプトの回避策に最も慣れているため、私はserverfaultを使用しました。

15 ssh bash nagios

5

Windowsがセーフモードで実行されているかどうかを確認するにはどうすればよいですか？

更新後にセーフモードで再起動することがあるWindowsサーバーがあります。私はその問題に取り組んでいますが、本当に知りたいのは、Windowsがセーフモードで実行されているかどうかを確認する方法です。理想的には、状態とともにパッシブチェックをNagiosボックスに送信するスクリプトにそれを組み込みたいと思います。私が使用できる環境変数や、コマンドラインからこの情報を取得する方法はありますか？

14 windows windows-server-2003 nagios command-line-interface

6

監視サーバーをどのように監視しますか？

そのため、CentOSでGroundworks（Nagiosを使用）を実行して、さまざまなサーバーとプロセスを監視します。警告または重大な状態になったときに、電子メールとSMSテキストを自動的に送信するように設定しています。通常、これは完全に機能します。ただし、Postfixが電子メールの送信を停止することを決定したサーバーでPostfixに問題が2回発生しました。誰も気付かなかったため、最新の時間は4日間続きました。それは重要な質問につながります。監視サーバーをどのように監視するのですか？

14 email monitoring postfix nagios sms

6

check_loadに使用する警告とクリティカルの値は何ですか？

現在、私はこれらの値を使用しています： # y = c * p / 100 # y: nagios value # c: number of cores # p: wanted load procent # 4 cores # time 5 minutes 10 minutes 15 minutes # warning: 90% 70% 50% # critical: 100% 80% 60% command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4 しかし、これらの値はほとんどランダムに選択されています。 …

13 monitoring nagios

3

Nagiosでスケジュールされたダウンタイムをキャンセルするにはどうすればよいですか

Nagios 3.5.1モニターを多数のサーバー用に用意しています。DrupalまたはWordpressのコアアップグレードなどのアクションを実行する際に、サイトを停止し、Nagiosを予定された停止に設定します。時々、2時間のデフォルトで終了し、停止を無視したくないことがあります。Nagiosに完了したことを通知し、スケジュールされたダウンタイムをキャンセルするにはどうすればよいですか？

12 nagios

3

すべての送信メールを/ dev / nullに送信します

sendmailを使用して、すべての送信メールを/ dev / nullに送信する方法、または単にメールがキューに入れられたり送信されないようにする方法開発nagiosボックスでは、通知が送信されないようにメールの送信を禁止します。アウトバウンドメールを停止すると、nagiosの設定をそのままテストして、偽の通知を防ぐことができます。

12 sendmail nagios

2

地理的に分散した、フォールトトレラントで「インテリジェントな」アプリケーション/ホスト監視システム

ご挨拶、分散監視システムに関する集団の意見と見解を尋ねたいのですが、何を使用し、どのボックスが私のボックスにチェックマークを入れるのかを知っていますか？要件は非常に複雑です。単一障害点はありません。本当に。私は真剣です！「マスター」と「ワーカー」の両方の単一/複数ノード障害に耐えられる必要があり、監視場所（「サイト」）に複数のノードが存在しないか、同じネットワーク上にあると想定できます。したがって、これはおそらく、DRBDやキープアライブなどの従来のHA技術を排除します。分散ロジック、複数のネットワーク、複数のデータセンター内、複数の大陸に5つ以上のノードを展開したいと思います。顧客の視点からのネットワークとアプリケーションの「鳥の目」ビュー、50以上のノード、さらには500以上のノードがある場合でも、監視ロジックが動かなくなることのないボーナスポイントが必要です。球場の数値では1500〜2500のホストとホストあたり30のサービスを想定しているため、かなり合理的な数のホスト/サービスチェック、la Nagiosを処理できる必要があります。監視ノードを追加することで比較的直線的にスケーリングできるようになり、5年後には5000ホストとホストあたり40サービスを監視できるようになると思います。上記の「分散ロジック」についてのメモに追加して、次のように言ってください。通常の状況では、これらのチェックは監視ノードの$ nまたはn％で実行する必要があります。障害が検出された場合、ノードの別の$ nまたはn％でチェックを実行し、結果を相関させてから、それらを使用して、アラートを発行する基準が満たされているかどうかを判断します。グラフと管理しやすい機能。SLAを追跡し、「高可用性」アプリケーションが24時間365日稼働しているかどうかを知る必要があります。理想的には、提案されたソリューションは最小限の労力で「箱から出して」報告する必要があります。オーダーメイドチェックを開発するための堅牢なAPIまたはプラグインシステムが必要です。アラートについて賢明である必要があります。1つの監視ノードがコアルーターがダウンしていることを認識していることを（SMSを介して、午前3時に！）必ずしも知りたくありません。私はないそれらの定義された割合があれば知りたい同意何かファンキーが起こっていること。）基本的に私はおよそここで話していることは、「定足数」の論理、または分散狂気への正気のアプリケーションです！私は商用とオープンソースの両方のオプションを検討したいと思いますが、数百万ポンドかかるソフトウェアを避けたいと思います:-)また、これらすべてのボックスをチェックするものが何もないかもしれないことを受け入れます集団にそれを尋ねたかった。ノードとその配置を監視することを考えるとき、これらのほとんどはランダムISPネットワーク上の専用サーバーであり、そのため主に私の制御範囲外になることに留意してください。BGPフィードやその他の複雑なネットワークのふるまいに依存するソリューションはおそらく適切ではありません。また、Nagios、Zabbix、友人など、過去のほとんどのオープンソースのフレーバーを評価、展開、または頻繁に使用/カスタマイズしたことも指摘しておく必要があります。特に、私の質問で説明されているロジックと「インテリジェント」アラートに関して。必要な点を明確にしてください。乾杯のみんなとギャル:-)

12 monitoring nagios sla

6

特定のプロセス/サービスが実行されているかどうかを確認する汎用Nagiosプラグイン？

http://exchange.nagios.orgで、sendmail、xinetd、automount、ypserv、ypbind、mailscanner、mcafee、clamav、samba server、およびopenvpnが実行されているかどうかを確認するプラグインがないことがわかりました。もちろん、これらはすべて安定したプログラムである必要がありますが、重要なため、実行されているかどうかを確認したいと思います。質問特定のプロセスをチェックする汎用プラグインはありますか？

12 linux ubuntu centos nagios

8

NagiosとOpen NMSの主な違いは？

私はマネージャーに包括的な監視システムを提案したいと考えており、OpenNMSを検討しています。しかし、私はここでナギオスの熱烈な賞賛を見てきました。彼らの焦点は異なりますか、それとも単に競争相手ですか？ある程度の背景があれば、6つのオンサイトサーバー（ファイルサーバー、PBX、プロキシ、アプリケーションなど）と2つのオフサイトサーバー（Webサイト/開発）をいくつかのスイッチとルーターと共に実行します。インストールする監視サービスは、freeBSDを実行する別の変換されたデスクトップで実行されます。私たちのものはすべて、LinuxまたはBSD派生物を実行します。私たちはこれを実装するためにお金を使わないことを探しています（ため息）。助けてくれてありがとう。編集 openNMSは、私が望むものに近い、より包括的なソリューションを提供するようです。ただし、Javaで記述されており、ポートがまだ公式のポートツリーにないため、拒否されました。NagiosがMRTGキャンペーンよりも優れているようになりました。迅速な対応をありがとう。 -機会

12 networking monitoring nagios network-monitoring opennms

2

誰もがNagiosにcheck_mkを使用していますか？検討する前に知っておくべきことはありますか？

http://mathias-kettner.de/check_mk.html いくつかの開発マシンでテストしてきましたが、かなり気の利いたようです。ただし、その展開に関する多くの情報は見つかりません。誰もがこれを積極的に実行していますか？誰かが何らかの理由でこれをオプションとして除外しましたか？

11 nagios check-mk

9

Nagios設定GUI [終了]

閉まっている。この質問はトピック外です。現在、回答を受け付けていません。 5年前に閉鎖されました。ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。ネットワーク上のサービスにNagiosを実装しましたが、うまく機能しています。通知は素晴らしく、幅広い構成オプションは非常に便利です。ここまでは、ファイルを直接変更することにより、すべての構成を手作業で行ってきました。他の一部の管理者にこれを少し公開し始めたので、エラーの可能性を減らすGUIを実装したいと思います。私はいくつかの異なるGUIプロジェクトをチェックアウトしましたが、これまでのところNagiosQLとNConfがこれまでのトップ候補であるようです。これら2つの間に、またはおそらく他の考慮すべき推奨事項はありますか？インストールと使用のストーリー、「落とし穴」、決定に役立つヒントについてはどうですか。

11 nagios graphical-user-interface

5

EC2を使用する場合、Nagios / Capistranoの設定にどのように対応しますか？

私はモバイルアプリにAmazon EC2を使用しています。特定の時点でのアプリケーションの負荷に応じて、新しいインスタンスを生成し、負荷が低いときにそれらを削除して、コストを節約します。このような動的環境のNagios構成にどのように対応しますか？管理されたハードウェアを扱う場合、構成ファイルは予測可能です。この場合、Nagios、Capistrano、およびその他の構成ファイルの束を追加する必要があります。Capistranoは、アプリサーバーの新しいビルドをどこにデプロイするかを知る必要があります。Nagiosは、既存のインスタンスを削除するか、監視する新しいインスタンスを追加することを知る必要があります。Nagiosは、ノードが意図的に停止されたのか、エラーのためにホストが停止されたのかを知る必要もあります。これは、VPS /動的インスタンスの素晴らしい世界でどのように行われますか？

11 amazon-ec2 amazon-web-services nagios configuration-management capistrano

4

yum updateが最後に実行された時期を確認する方法

yum updateシステムで最後に実行された時間を知るための正規の方法はありますか？私たちのセットアップでは、自動更新を実行するステージングサーバーがあり、それらがフォールオーバーしない限り、月に1回程度（重要な更新を除き）手動で運用サーバーを更新します。（私は手動で言いますが、理想的にはそれらすべての更新を手動でトリガーしたいのですが、それは別の問題です）。しかし、あなたは忙しくなり、タスクはスリップします。それで、私がそれをあまりにも長く残している場合、私たちを悩ませ始めるnagiosチェックをセットアップしたいと思います。ウェブを検索しても、それほど遠くはありません。システムをたたくと、私がこれまでに見つけた最良のものは次のようなものになります： grep Updated /var/log/yum.log | tail -1 | cut -d' ' -f 1-2 これによりMar 12、日付に変換できるようなものが得られます。日付が今年なのか去年なのかについて、いくつかの小さな問題があり/var/log/yum.log.1ます。また、logrotateの直後にチェックする場合は、チェックする必要があります。しかし、それは単なるスクリプトの詳細です。もちろん、これは一般的な更新ではなく、単一のパッケージへの更新によって「だまされる」可能性があります。では、いつyum update実行されたかを確認するためのより標準的な方法はありますか？編集：私は今、私が質問で提案したアイデアを使用するNagios NRPEプラグインを作成しました。https://github.com/aptivate/check_yum_last_updateから入手できます。

11 nagios yum package-management update

5

Nagiosサーバーのベストプラクティス？

中規模のNagiosサーバーを実行しています。現在、約40のサーバーと180のサービスを監視しており、日々成長しているだけです。非常に難解な方法で構成された古いNagiosセットアップから移行したため、すべてを最初から再構成する必要がありました。サーバーが実行され、必要なほとんどの機能が動作するようになったので、サーバーをもう少しスケーラブルにすることを検討しています。現在、各ホストは内の独自のファイルで/etc/nagios/hosts/あり、各ホストは同じファイル内にすべてのサービスを持っています。これは明らかに最適ではありませんが、私の構成すべてを数百の異なるファイルに難読化することもありません。だから私の質問はこれです：経験豊富なNagios管理者にとって、設定を過度に複雑にすることなくホストグループ/サービスグループを利用する最良の方法は何ですか？

10 linux nagios network-monitoring best-practices

1

getfattrが拡張属性ビットが設定されているファイルに対して何も表示しないのはなぜですか？

CentOS 6.2でNagios XIインストールを実行していて、バックアップスクリプトを変更したいと考えています。このシェルスクリプトに拡張属性ビットが設定されていることに気付いたので、変更を加えても混乱しないようにしたい。実験したところ、「cp -p」ではこの設定が保持されないことがわかりました（これに関する更新についてはコメントを参照してください）。Linuxの拡張属性は初めてですが、拡張属性を表示するはずの「getfattr」コマンドがあることがわかりましたが、このファイルには何も表示されません。 cd /usr/local/nagiosxi/scripts ll backup_xi.sh -rwxr-x---. 1 nagios nagios 2757 Jul 3 10:03 backup_xi.sh* # nothing is displayed by 'getfattr': getfattr -d backup_xi.sh # and nothing special seems to be present according to 'getfacl': getfacl backup_xi.sh # file: backup_xi.sh # owner: nagios # group: nagios user::rwx group::r-x …

10 centos nagios files attributes

タグ付けされた質問 「nagios」

タグ付けされた質問「nagios」