サーバーを監視するためにどのツールを使用しますか?


187

監視ツールとその機能のより包括的なリストについては、このウィキペディアのページをご覧ください

質問が述べているように、このタスクに使用される最も一般的に使用されるツールは何であり、それらの長所と短所は何ですか?


サーバーはどのプラットフォームで実行されていますか?
グレンスラベン

1
私のサーバーはDebian Lennyを実行していますが、多くのツールが何らかの形でクロスプラットフォームをサポートしている可能性が高いため、質問は主にUNIX監視だけに焦点を合わせていません。
アロンロットベール2009

異なるツールを使用しているかもしれませんが、システム全体の観点からすると、異なるシステムで同じことを何度も繰り返し行うことになります。必要なデータの最後のビットを絞り出すのは、ほんの少しのスクリプトです。このコンテキストでの「ツール」は、データを吐き出す実際のプラグイン/スクリプトではなく、レコーディングインスタンス(監視サーバー)であると考えます
。serverhorror

アプリケーション(パフォーマンス、可用性など)も監視するのが好きです。監視ツールには、一方の端でハードウェアを監視する能力と、もう一方の端でアプリケーションを監視する能力があるスペクトルがあるようです。ハードウェア<----- + ----->アプリケーション
ネイサンハートリー

回答:


136

過去にNagiosを使用して成功しました。非常に拡張性が高く(200以上のアドオン)、比較的使いやすく、多くのレポートがあります。ネガティブは初期セットアップです。


10
Nagiosは、すべてのタイプのホスト(Windows、Linux、ルーター、スイッチなど)の監視に最適です。fruityやLilactoなどの構成ツールを使用して、構成の痛みを緩和することをお勧めします。実行中のプロセス、ディスクの使用状況などを監視するための、Windowsボックス上のNSClient ++およびLinuxスタッフのnagios-statd
TonyB

残念ながら、NagiosはWindowsボックス上のエージェントを必要とします-過去に、エージェントがランダムに死ぬ傾向があることで有名です。
PowerApp101 09年

監視のためにNagiosとZabbixの両方を調べました。Zabbixは、主に展開と機能性が理由で短い評価の後に勝ちました(たとえば、Zabbixにはコア機能としてグラフが含まれていますが、Nagiosにはプラグインが必要です)。Nagiosを設定するのは苦痛でした。

GroundWorkのオープンソースは、コアだし、セットアップ/管理を簡素化でNagiosのを使用するネットワーク監視アプライアンス持っている
Rogメール

12
icingaと呼ばれる新しいnagiosフォークがあります。まだどこにもありませんが、彼らの目標は有望に見えます。icinga.org
cstamas

70

CactiRRDToolの非常に優れたWebベースのフロントエンドであり、非常に便利なグラフと統計情報を提供します。 RRDToolは、複数のシステムからデータを収集し、さまざまな技術データを監視する部分です。

このcacti / RRDToolソリューションを使用して、UnixおよびWindowsシステムを監視しています。負荷、CPU / RAM使用量、HDスペース、ログインしているユーザー、ネットワークトラフィック、実行中のプロセスなど、多くの有用なメトリックを取得します。

サボテンの詳細については、サボテンとはをご覧くださいページ。


Cactiは、見栄えが良く、お求めやすい価格(無料)の楽しいソリューションです。ただし、ネットワークデバイスのセットアップはPITAであり、文書化が不十分でした。今はもっと良いかもしれませんが、あなたが研究を終えるまで私はそれにコミットしません。
クリスポーター

57

個人的には、Muninは非常に簡単なアーキテクチャであるため、インストールとプラグインの作成が非常に簡単です。あなたが想像できるすべての目的のために、すでに非常に多くのプラグインが存在しているので、最初からプラグインを書く必要さえないでしょう。

また、美しいグラフと(非常に基本的な)アラートを構成するオプションも提供します。


2
私もムニンの大ファンです。Nagiosとの統合をサポートしているため(両方を実行できます)、unixのすべての一般的なフレーバーをサポートしています。Windowsノードの監視はサポートされていないと思いますが、Perlで書かれているため、簡単ではないかもしれませんが、確かに可能です。
ジョンダルトン

2
@ジョン。Windowsノードは、ネイティブmuninノードであるmunin-node-win32を介して、またはホストと同様にSNMPを介してサポートされます。
スティーブシュネップ2009年

34

ZABBIX。オープンソースであり、セットアップとカスタマイズがかなり簡単です。zabbixサーバーにフィードするカスタム監視スクリプトがたくさんありますが、そのデータの集中化、適切な表示、通知(電子メール、IM、SMS、Twitterなど)などを処理します。


2
また、Zabbixを使用しているため、非常に強力で構成可能です。ZabbixとNagiosの両方をテストし、最終的にZabbixを選択しました。Nagiosは評判が良いように見えますが、インストールするのは少し苦痛であり、多くの機能はコアアプリケーション内で機能するのではなくプラグインに由来するためです(グラフはこの好例は、Zabbixで無料で入手できます)。

3
Zabbixは、インフラストラクチャのグラフ化とマッピング(可用性)の点で柔軟性があり、監視の方法も柔軟なので、Zabbixが好きです。
アンドリオイド2009

29

私は会社でSpiceworksのロールアウトを行ってきましたが、サーバーの監視だけでなく、ネットワーク上の他のすべてを監視するための優れたツールであることがわかりました。

自動インベントリやカスタムモニタリングなどの処理を行って、問題がある場合にメールを送信します(例:プリンターがインクの10%に達しているか、このサーバーのハードドライブに20%があります)。

そのマイナス面は、おそらくコンピューターごとの情報の密度です。誤解しないでください。マシンごとに大量のデータがありますが、サーバーのような多くの統計が必要な場合は、別のツールを使用する必要があります。

編集:ああ、私はそのビジネスモデルはそれが永遠に無料であることに基づいていることを言及しました。


Spiceworksは多くの素晴らしい機能を無料で提供しています。

3
SpiceWorksには、ServerFaultとかなり重複する非常に大きなコミュニティがあります。コミュニティ間の相互作用を見るために面白くなります。私もSpiceWorksを使用しています。素晴らしいツール。
スコットアランミラー

推奨に基づいてこれを使用しています。優れたツール。
マルコカーター

私たちは仕事でそれを使用します。とても印象的です。ソフトウェアは言うまでもなく、ハードウェアのインベントリだけでも、一見の価値があります。
テリー

前回Spiceworks(バージョン3の何か)を使用したとき、モニター、ビデオカードなどのハードウェアコンポーネントを追加または変更する方法がありませんでした。それらを検出しますが、多くの場合は正しくありません。したがって、私はまだ私が嫌いな GLPI + OCSNGを使用しています。
ボーデン

18

喫煙は、さまざまなサーバーとサービスの可用性をチェックするだけでなく、それらの遅延を追跡しながら、使いやすく、見栄えがよく、グラフをすばやく表示します。

広範な遅延測定プラグインがすぐに利用できます。Perlの知識があれば、エキゾチックなニーズに合わせて独自のPerlを簡単に作成できます。

大規模な設置では、分散測定のためにマスター/スレーブシステムの恩恵を受けます。

高度に設定可能な警告システムは、ユーザーに影響を与えたり、重大な機能停止に発展する前に問題に気付くのに役立ちます。

Smokepingは無料であり、MRTGおよびRRDtoolの作成者であるTobi OetikerによってPerlで記述されたオープンソースソフトウェアです。


スモーキングは、ネットワークがどのようなものであるかを確認するのに適しています
Rory

レイテンシーを視覚化するには、喫煙は驚くべきものです。
ジェームズ

15

OpenNMSは、私が1,000を超えるLinuxマシンを監視するために働いている場所で使用されています。各マシンのハードウェアとそれらで実行されているアプリケーションを監視します。


OpenNMSには+1を使用し、これを職場で使用して数千のマシンとインターフェースを監視します。さまざまなオペレーティングシステムがあり、OpenNMSを使用してそれらすべてを監視できます。
スティーブK

ではない私の最初の選択が、非常に便利

新しいハードウェアにMIBを追加するとどうですか?
slovon

OpenNMSには多くのsnmp統計が既にデフォルト設定にあるため、すぐに自動検出してグラフ化を開始できます。新しいSNMP統計は簡単に追加できます。RRDの名前、OID、およびデータタイプを指定し、統計が適用されるデバイスのタイプのグループに入れてください。
mtinberg

15

Zenoss Coreはある程度の用途があります。サーバー、ネットスイッチ、UPSの軽量監視に(約1年間)使用しています。

Zenoss Coreは、受賞歴のあるオープンソースIT監視製品であり、単一の統合ソフトウェアパッケージを通じて、ネットワーク、サーバー、アプリケーションの構成、正常性、パフォーマンスを効果的に管理します。


Zenoss Coreの無料版を使用する場合は、SNMP MIBの調整を多数行う準備をしてください。また、一部のサーバーでオペレーティングシステムデータを収集することを断固として拒否し、Webページのコンテンツをチェックするなどの単純なタスクをセットアップするのが驚くほど難しいこともわかりました。
gareth_bowles 2009年

MIBの問題に共感できますが、WebページのチェックはZenossのNagiosプラグインで実行できます。
ギメル2009

12

Nagiosは無料で、多くのプラグインが用意されているので素晴らしいです。ただし、UIと設定は非常に困難です。

pro / con'sの正反対は、Microsoft System Center Operations Manager(SCOM)は無料ではなく、プラグインが少ないですが、セットアップと構成は見事で簡単です。

私が主にマイクロソフトの会社にいた場合、信頼性の要件が非常に高い(つまり、監視を中断する余裕がない)場合、または開発者がそれを使用できるようにする必要がある場合は、SCOMがNagiosよりも推奨されることを認めなければなりません。


12

私が使用した:

  • Nagiosは -かなりますが、頑丈で機能していないいくつかの古いtimeyコマンドラインセットアップが必要です。次のものに取って代わられました。
  • Zenoss-セットアップに必要なフットワークがはるかに少なく、商用版があります。実行すると、残りはブラウザを介して制御されます。非常に強力ですが、無料版を使用する場合はMIBの作業が必要です。
  • インターマッパー -商用プログラム、監視するノードがたくさんある場合は費用がかかります。Javaで記述されているように見えます(良くも悪くも)。
  • Spiceworks-最新バージョンを試していません。古いバージョンでは、応答するためにボンネットの下にもう少し必要がありますが、それ以外の場合はうまく動作します。無料版にはナグ広告が付属しています。

インターマッパーを幅広く使用しています。
sysadmin1138

InterMapperも使用します。コンソールクライアントはJavaで記述されています。サーバーはPythonで書かれています。Postgresは、データの集約とレポートのバックエンドデータベースとして使用されます。
lsiu

11

AlertFoxは数週間から使用しており、非常に満足しています。稼働時間とパフォーマンスをチェックするだけでなく、ショッピングスクリプト、ユーザーログイン、Webサイトのその他の重要な部分をトランザクションスクリプト(iMacrosベース)で監視します。

内部監視(ディスク領域など)にはNagiosを使用します。


10

PRTG Network Monitor-それについて十分なことを言うことができません。素晴らしいWebフロントエンドであり、特にSNMP(ルーターなど)やその他のデバイスをSNMPで監視し、SLAなどのアップタイムを測定するのに最適です。

www.paessler.com


9

Windows担当者、MOMとして。Systems Center Operations Manager(SCOM)へのアップグレードを検討していますが、Windows 2008の展開を開始するまでアップグレードする必要はありません。


MOMも使用します。私はそれを愛していると同時に嫌いです。
spoulson

SCOMは、Windowsベースのエンタープライズ環境向けの優れた監視プラットフォームです。ここでの真の天才は、Microsoft製品グループ自身がリリースした管理パックです(これは、RTMから90日以内にすべての製品にSCOM MPが存在するというMS Common Engineering Criteriaの一部です)。製品チーム自身からアドバイスや知識を得ると、運用部門の能力を大幅に向上させることができ、あらゆる小さなことに上級管理者を煩わせることなく、物事を実行し、健全に保つことができます。
ケビンコルビー

8

私は運用監視アップグレードプロジェクトに参加しています。いくつかの大きなシステムを提示するために、さまざまなベンダーがオンサイトに来て、比較するためにいくつかの安価な代替品を混在させました。

その1つがHypericで、これは無料のオープンソースソリューションとしても利用可能です。提供された機能とカスタムエージェントの拡張性に感銘を受けました。


リソース上では簡単ではありませんが、確かに優れた監視ツールです!
ヴァンサンドバエール2009年

8

統計(メモリ使用量、負荷、mysqlアクティビティ、apacheアクティビティなど)を監視するために、Muninを使用します。箱から出してすぐにさまざまな時間間隔(過去24時間、過去7日間、先月、昨年)で多くのことを既に追跡し、グラフをプロットします。プラグインを通じて、さらに多くのものを監視できます。出力は、きれいなグラフを持つHTMLページです。

Muninにはマスター/ノードアーキテクチャがあります。ノードはサーバー上の統計を収集し、マスターはデータを保存し、HTMLとグラフを生成します。

Monitを使用して、実行中のプロセスを追跡し、特定の構成可能な条件(高CPU負荷、高メモリ使用量、HTTP応答なしなど)が発生した場合に再起動または警告します。負荷、メモリ使用量、ハードディスクの状態、ディスク使用量。

Monitは、監視するすべてのサービスまたはハードウェアと、問題が発生した場合の対応方法ごとに構成する必要があります。最も使用されるオプションは、何もしない、警告メールを送信する、またはサービスを再起動することです。

Monitは正常に機能しますが、サービスの開始、停止、または再起動に失敗することがあり、何が問題なのかを示すための診断情報があまりありません。これは、問題がサービスにあるのか、cronのような最小環境で実行されるMonitの構成にあるのかわからないことを意味します。

両方のツールは、ほとんどのLinuxディストリビューションでデフォルトで利用可能です。


8

誰もLinuxサーバーのlogwatchlogcheckについて言及していないことに驚いています-ログを読む時間を大幅に節約できます!!


これらのツールは、インフラストラクチャの傾向のメトリックと長期的な可読性を実際に提供することはありません。それらは素晴らしい追加ですが、私はそれらに頼るだけではありません。Afaikの「logwatch」は、ツールに既知のものを通知する「logcheck」とは対照的に、エラーを報告するだけで、それ以外のすべてを報告するため、やや悪です。
serverhorror


7

このプロジェクトでは、100以上のノードクラスタにGangliaを使用しています。使用する理由の1つは、Rocksに付属する監視ツールだからです。

できるだけ多くのリソースを計算に使用できるように、各ノードのオーバーヘッドを非常に低くすることが重要です。Gangliaを使用すると、クラスターの概要を把握でき、必要に応じて個々のノードにドリルダウンできます。現在何が起こっているかを知ることに加えて、過去1時間、1日、1週間、1か月、1年に何が起こったのかをかなりよく見ることができます。さまざまな統計のグラフは基本的かつ機能的です。


6

それはすべて「モニター」の意味に依存します!

  • (システムまたはサービス)は利用可能ですか?nagiosを使用します
  • 何してるの?Linuxサーバーにはmuninを使用し、他のほぼすべてにはcactiを使用します。
  • 何をしましたか?syslog-ngを使用してsyslogを1か所に集中してから、カスタマイズされたlogcheckスクリプトを毎日実行して、電子メールでレポートを送信します。Windowsサーバーに似たものを探しています。

5

CactiおよびRRDToolベースのソリューションとの競合をチェックするための新しい参加者は、Graphite(http://graphite.wikidot.com/)です。

RRDToolは、Whisperと呼ばれるバッキングストアに置き換えられます。このドキュメントは、なぜ異なるのかについてかなり良い概要を示しており、何かを調査するときにアドホックグラフを作成するCLIが本当に好きです。


4

比較的小規模なWindowsネットワークには、IpswitchのWhatsUpを使用しています(および同様) 。セットアップは簡単で、管理は比較的簡単で、Windowsサーバーや標準的なものを扱う方法を知っています。

大規模なネットワーク、非Windows指向のネットワーク、または多種多様なネットワークの場合、OpenNMSを心からお勧めします。OpenNMSソフトウェアが無料の場合、会社はサポートサービスと実装サービスを喜んで販売します。また、大学の非常に鋭い友人によって運営されていることもあります!


4

Nagios Webインターフェースが気に入らない人のために、NactのプラグインであるNPCがあります。このプラグインは、Cacti内からNagios UIを使用可能にしますが、見た目は良くなります(ajaxなど)。

NDO2DBが提供するデータベースから読み取ります。これは、スクリプトやその他のツールで使用するためにデータベース内からインフラストラクチャを利用できる素晴らしい方法です。


4

現在、Paesslerの PRTGを使用しています。素晴らしいです。エージェントは不要で、優れたAjax Webインターフェイス、履歴ロギング、グラフ作成、WMIなどがあります。無料で利用できる10のセンサーバージョンがありますが、エンタープライズバージョンにはいくつかの壮大な機能があります。お金はうまく使いました。


4

ホビット-これは、Big Brotherのより高速なバージョンです(最近、驚くほど商用化されているようです)。

http://hobbitmon.sourceforge.net/


また、Hobbitを使用しています。これは素晴らしいです。それぞれ10以上のモニターを備えた600以上のサーバーを処理し、それらの多くは毎分更新されます
MarkR

1
ホビットは現在Xymonと呼ばれています。 hswn.dk/hobbiton/2008/11/msg00123.html
クリントンブラックモア

4

急いでいて、MSサーバーを監視するクイックツールが必要な場合は、Windowsのパフォーマンスモニターを使用し、カスタム監視テンプレートとカスタムスケジュールを使用してカウンターログを設定します(例:1時間ごとに5分間データを収集します)。次に、MicrosoftのLogParserおよびCodeplexのログのパフォーマンス分析(PAL)ツール(http://pal.codeplex.com/)をダウンロードして、カウンターログを処理します。PALは、問題を解決する可能性のあるドキュメント/ツールへのリンクを含む優れたドキュメント化されたレポートを生成します。


3

Solarwinds、VMwareサーバーのパフォーマンスタブ、およびカスタムスクリプトを組み合わせて使用​​します。

Solarwinds Orion Network Performance Monitorは、Windowsシステムで使用するものです。Webサーバーの管理者。いくつかの便利なアプリメトリックが実行されていますが、基本的なボックスレベルのもの(ディスク、ネットワーク、CPU)に関する良い情報があります。

VMwareゲストの場合、パフォーマンスタブが気に入っています。

私のSunサーバーでは、Solarwindsで利用できないものが必要な場合(管理者が追加したものや何を使用していないため)、ミラーの状態、スワップの使用状況などを監視するカスタムスクリプト(通常はPerl)を作成します。

Solarwindsをもっと使いたいのですが、1日でたった26時間しかありません(または、上司はそう信じています)。


3

Nagiosの上で実行されるOpsViewを使用します。webUIは、SSHアクセスを許可せずに新しいホストモニター定義を展開し、パブリックビューを提供し、履歴値を記録するのに役立ちます。これは、適切なベースラインのプロビジョニングと決定に便利です。



2

申し訳ありませんが、多くのカスタムスクリプトを使用することになりました。理想からはほど遠いですが、もっと一般的な解決策があるとは思いません。


カスタムスクリプトが常に必要になります!
Techboy

2

独自の監視ソフトウェアを作成しました。コードは市販のパッケージほど洗練されていませんが、多くの機能は必要ありませんでした。他のパッケージを調査して使用方法を学ぶよりも、独自のパッケージを作成する方が簡単でした。コードは私たちが望んでいることを実行し、簡単に拡張できます。


2
私は、このような決定の意味合いを通して考えることが重要だと思います。ゼロから何かを書くことはそれほど労力ではないかもしれませんが、今後のメンテナンスは負担です。
アダム

メンテナンスが問題になることは想像できましたが、このシステムを何年も実行していても、私たちにとってはそうではありませんでした。コードベースは小さくて使い慣れているため、必要に応じて新しい機能を簡単に追加できます。商用ソリューションを維持すること等も、元の製品はあなたが必要なすべてを行っていない新しいベンダーからの作品、上で移植、時間をかけて問題になる可能性
ジョンD.クックは
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.