NagiosグラフソリューションとMunin / Cacti / Ganglia


9

監視するためのnagiosサーバーのセットアップが30台まであります。トレンドチャートをいくつか追加したいと思います。nagiosのグラフ作成プラグインはシンプルで、多くの人が独立したスタンドアロンのグラフ作成/傾向分析ツールを使用していることを読んだことがあります。

nagiosグラフプラグインとganglia / munin / cactiのようなスタンドアロン製品の制限は何ですか?

スタンドアロンパッケージが提供し、nagiosグラフプラグインが提供しない特定の機能と利点に興味があります。


また、Zabbixの...検討すべきであるserverfault.com/q/109595/2039
sebthebert

nagiosベースのopsviewコミュニティエディションをお試しください。異なるLinuxフレーバーにインストールするか、VMをダウンロードできます。opsview.com/downloads/download-opsview-community
Matias Dominoni

記録のために:私はnagiosgraphを試してみましたが、それでこだわりました。私はそれが提供するものにかなり満足しています
sumek '05

回答:


7

nagiosが既にインストールされている場合は、nagiosgraphまたはpnp4nagiosを検討してください。

nagiosgraphとpnp4nagiosは、nagiosパフォーマンスデータのプロットに非常に優れています。nagiosgraphには設定にパラメーターベースのアプローチがあり、pnp4nagiosにはテンプレートベースのアプローチがあります。

  • nagios設定が変更されるたびに、両方とも自動的に新しいホスト/サービスを検出します
  • どちらもグラフのズームを行います
  • 特定のホスト/サービスの上にマウスを置くと、どちらもグラフを提供します
  • どちらも、データをスライスおよびダイスする多くの方法を提供します
  • nagiosで既に定義したクリティカルレベルと警告レベルを検出してグラフ化する
  • 両方をnagiosフレームに直接埋め込むことができるため、現在のステータスから履歴まで、そして戻って、シームレスで整理されたナビゲーションを実現

データのスライスとダイシングは非常に重要です。たとえば、単一のホスト上のすべてのサービスを表示したり、特定のサービスを持つすべてのホストを表示したり、任意のホストおよびサービスのグラフの任意のコレクションを表示したりできます。

インストールは簡単ではありませんが、難しくはありません。多くは、どれだけカスタマイズしたいかによります。たとえば、nagiosgraphは「install.pl」または「rpm -i nagiosgraph.rpm」または「dpkg -i nagiosgraph.deb」です。pnp4nagiosは './configure; 作る; インストールを行います。

n2rrdはこれらの機能のいくつかを実行することもできますが、それほど洗練されておらず、構成するためにより多くの作業が必要です。

rrdtoolにはデータストレージの癖があり、どのシステムでもサンプリングの問題が発生します。rrdtoolはデフォルトでいくつかのデータ平滑化を行いますが、必要に応じて平均に加えて最大値および/または最小値を取得(およびグラフ化)できます。

各rrdファイルのスキーマは静的であり、ほとんどのシステムはrrdファイル名を使用してデータを識別するため、すべてのrrdtoolベースのアプローチはデータ/グラフの古さに悩まされます。ホスト名またはサービス名が変更されても、通常、データが失われることはありません。RRDファイルはまだディスク上に存在します。ただし、一部のユーザーインターフェイスは「古い」RRDファイルを表示する方法を提供し、その他のユーザーインターフェイスはコマンドラインから手動でハウスキーピングを行う必要があります。多くのインストールでは、これはシステムを最初に構成するときの問題にすぎませんが、動的な環境(たとえば、寿命が数か月の仮想マシンの監視)では面倒になる可能性があります。

最後に一言。傾向分析には、実際にはデータ収集とデータ表示の2つの部分があります。既存のnagiosインストールを拡張するのではなくスタンドアロンのグラフ作成システムを使用する場合、データを収集するためにWindowsマシンに追加のコンポーネントをインストールする必要がある場合があります。


13

私はlynxmanに同意します。NAGIOSは、即時の定性データ用です(Xは大丈夫ですか?)。muninは、過去の量的データ用です(Xは現在どのくらいいっぱいで、今年はどれくらいいっぱいですか?)。数百のサービスを監視しているNAGIOSのすべてのインストールは、量的監視を行うためにmuninシステムにリンクされています。

また、muninにはNAGIOSにデータを送るための特定のフックがあることに注意してください。WARNINGとCRITICALのしきい値の概念を理解し、通知(およびNAGIOSの「ビッグボード」のビュー)が必要な場合、単一のmunin変数で単一のNAGIOSサービスの状態を通知するのは非常に簡単です。

通常のワークフローは、NAGIOSがしきい値に違反したことを警告するまで誰もmuninグラフを見ないが、その後muninグラフは、何かが時間の経過とともにゆっくりと増加しているかどうか、またはこれが限界かどうかを知るために非常に重要になります。 -青の増加、または振幅が徐々に増加する毎週の上下サイクル、または何があるか。

lynxmanが言うように、UNIXの方法は「1つのタスク、1つのツール」です。muninとNAGIOSのツールチェーンを作成することは、定量的および定性的な監視と通知を提供するのに非常にうまく機能します。また、インターフェースをクリーンに保つという明確な利点もあります。NAGIOSを見ると、履歴データがビューを乱雑にせずに、現在の状態がどのように機能しているかの簡単なビューが表示されます。muninを見ると、「ホストがダウンしている」または「sshdが私に話しかけない」というエラーがビューを乱雑にすることなく、分析の準備ができている問題に関連する履歴情報が表示されます。


3

Nagiosグラフプラグインは非常に制限されており、非常に基本的なrrdtoolインターフェースを提供し、UIデザインは少し直感的です。これは基本的にnagiosのハックであり、楽しみのためだけにそれを使用しようとしましたが、警告なしに何度か壊れました。

スタンドアロン製品(特にmuninまたはganglia)を使用すると、nagiosが達成できない幅広いサービスが提供されます。unixのマントラは、多くのことを上手にしようとするよりも、1つだけで上手である方が良いので、nagiosは素晴らしいですモニタリングとmunin / ganglia / cactiはグラフ作成に優れています。


では、この中にnagiosが達成できない幅広いサービスは何ですか?これは、私が興味を持ってるものです。
sumek

nagiosを使用すると、グラフデータを失うことは非常に簡単です。また、プラグインが特定の時間にデータのグラフ化を停止することも非常に簡単です。特定の時間にズームする可能性はありません(他のすべての場合と同様)。複雑な集計グラフを作成する可能性はありません。それは初心者のためだけです:)
lynxman

グラフデータを簡単に失うとはどういう意味ですか?簡単なグーグルは、言及された5つのソリューションすべて(ガングリア、ムニン、サボテン、pnpgraph、nagiosgraph)がグラフデータの格納にrrdtoolを使用することを示しています。
sumek

はい、私が言及しているのは、nagiosのグラフ作成ツールはハックであり、rrdファイル名とグラフ情報の間に不一致がある場合はいつでも壊れるということです。した後、
muninの

2

Stack Overflowでは、パフォーマンスデータをグラフ化するためのNagiosプラグインであるn2rrdを使用します。ある程度、ハックっぽい感じがするというlynxmanに同意します。

しかしながら:

  • n2rrdを使用すると、n2rrdに付属するrrd2graph.cgiの代わりに、データに基づいてCactiにグラフ化を実行させることができます。
  • n2rrdとrrd2graph.cgiはズームをサポートしています
  • 複雑な集約グラフに関しては、基本的には手動でRRDグラフを操作し、それらを使用して何でも実行できます。

RRDグラフはサーバー名に従って格納されるため、何かの名前を変更すると、データが失われます...常にファイルの名前を変更するだけでシンボリックリンクでき、データが失われることはありません。

これらのグラフのいくつかの例は、最近のいくつかのTips for Better RRD Graphs Server Fault Blogの投稿にあります。また、n2rrdページには、cactiデモとrrd2graphの両方が含まれています。

結論として、Nagiosのルートをたどると機能が1つまたは2つ足りないかもしれませんが、自分でrrdテンプレートを書く詳細にを煩わされてもかまわない場合は、ほぼ完全です *。おそらくより多くの時間を費やすことになるでしょうが、rrdでより多くの専門知識を開発することを奨励します。


1
* [参照されていない脚注エラー]:カイルに何を追加しますか。探究心は知る必要がある!
MadHatter、2011年

0

私は正確なデータを要求し、rrdのデータ表示は正確ではありません-正規化されています!最初は非常に正確なデータを使用していないため、ほとんどのユーザーにとってこれは問題ありません。サンプルレートが1分以上であることが多いデータを使用しているため、何が起こっているのかを正確に説明することはできません。これはまた、どこかでデータにスパイクがある場合、それを決して見ることができないことを意味します。

これを考慮してください-あなたのGbネットワークが約10MB /秒でハミングしていて、突然、数分間100MB /秒のスパイクがあるとします。また、それが30秒のスパイクだけだった場合は、数分のサンプリングレートでは表示されないこともあります。その日のデータを見ると、その「スパイク」は15MB /秒としか表示されないことがありますが、実際の値は他のいくつかの要因にも依存します。また、ネットワークが満足していないときにネットワークが満足していると思われる可能性も非常に高くなります。

私にとってさらにイライラするのは、グラフの物理的な幅とx軸の範囲に正規化されたデータです。これは、私があなたが見なかったと述べたスパイクとはどういう意味ですか?ズームインすると魔法のように表示されます!私はgnuplotに固執します-グラフはそれほどきれいではないかもしれませんが、それらは堅実であり、gnuplotはそれを表示する前にデータを変更することはありません。

-マーク


0

pnp4nagiosを使用すると、グラフ化に非常にうまく機能することがわかりました。ズームにも対応しています。実装するのは簡単ではありませんが、nagiosでこれを実現するのは簡単ではありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.