muninをインストールすると、デフォルトのプラグインセットがアクティブになります(少なくともubuntuでは)。または、単に実行munin-node-configure
して、システムでサポートされているプラグインを特定することもできます。これらのプラグインのほとんどは、単純なデータをプロットします。私の質問はありません(一部のも...多分)データの性質を説明するのではなく、何それはあなたがこれらのグラフに探していることでしょうか?
muninをインストールして、派手なグラフを表示するのは簡単です。しかし、グラフがあり、それらを「読み取る」ことができないと、グラフはまったく役に立たなくなります。
私のシステムではデフォルトで有効になっている標準プラグインをリストします。だから、それは長いリストになるでしょう。完全を期すために、理解したいと考えているプラグインをリストし、それが何に使用されていると思うかについて簡単に説明します。私がそれらのいずれかと間違っている場合は、喜んでください。
この質問を3つの部分に分けてみましょう。
- データさえわからないプラグイン
- データは理解しているが、何に注意すべきかわからないプラグイン
- 理解できると思うプラグイン
データさえわからないプラグイン
これらには、必ずしもムニンだけを対象としたものではない質問が含まれている場合があります。データを理解しないことは、通常、オペレーティングシステム/ハードウェアに関する基本的な知識にギャップがあることを意味します。
これらは、何が起こっているのかを推測できるだけのプラグインです...これらの「推測」を見たくはありません...
- デバイスあたりのディスクIO(IO /秒)
IOとは何ですか。私はそれが入力/出力を表すことを知っています。しかし、それはそれが行くところです。 - デバイスあたりのディスクレイテンシ(平均IO待機)
「IO待機」とは何の手掛かりではない... - IOサービス時間
これは大きな混乱であり、グラフに何かを表示することはほとんど不可能です。
データは理解しているが、何に注意すべきかわからないプラグイン
- IOStat(ブロック/秒読み取り/書き込み)
私は、ここで注意すべきことはスパイクだと思いますか?これは、デバイスが頻繁に使用されていることを意味しますか? - 利用可能なエントロピー(バイト)
これは乱数生成に重要だと思いますか?なぜこれをグラフ化するのですか?これまでのところ、値は常にほぼ一定でした。 - VMStat(実行中/ I / Oスリーププロセス)
このプロセスと「プロセス」グラフの違いは何ですか?どちらも実行中/スリープ中のプロセスを示していますが、「プロセス」グラフには詳細が表示されているようです。 - デバイスあたりのディスクスループット(バイト/秒の読み取り/
書き込み)これと「IOStat」グラフの違いは何ですか? - inodeテーブルの使用法
このグラフで何を探す必要がありますか?
理解できると思うプラグイン
私はここでいくつかのことを推測します...間違っている場合は修正してください。
- ディスク使用率(%)
使用されている/残っているディスク容量。これは100%に近づいているので、パーティションのクリーンアップまたは拡張を検討する必要があります。これはルートパーティションにとって非常に重要です。 - ファイアウォールスループット(パケット/秒)
ファイアウォールを通過するパケットの数。これが長期間スパイクしている場合は、DOS攻撃の兆候である可能性があります(または単に大きなファイルを受信しているだけです)。また、ファイアウォールのパフォーマンスに関する情報も得られます。それが横ばいになり、より多くの「パワー」が必要な場合は、ロードバランシングを検討する必要があります。それが横ばいになり、CPU負荷との相関が見られる場合は、ハードウェアの速度が十分でないことも意味している可能性があります。ディスク使用量との相関は、FW構成での過剰なLOGターゲットを示している可能性があります。 - eth0エラー(パケットイン/アウト)
ネットワークエラー。この値が増加している場合は、ハードウェアに障害がある可能性があります。 - eth0トラフィック(ビット/秒イン/アウト)
生のネットワークトラフィック。これはファイアウォールのスループットと相関があるはずです。 - スレッド数
増加する値は、プロセスがスレッドを適切に閉じていないことを示している可能性があります。調べろ! - processes
アクティブなプロセス(スリープを含む)の内訳。ここでの急激なスパイクは、フォーク爆弾を示している可能性があります。ゆっくりではあるが増加し続ける値は、アプリケーションがサブプロセスを生成しているが適切に閉じていないことを示している可能性があります。を使用して調査しps faux
ます。 - プロセスの優先順位
これは、プロセスの優先順位の分布を示します。優先度の高いプロセスのみを使用することはあまり役に立ちません。一部の優先順位を下げることを検討してください。 - cpuの使用法
かなり簡単です。これが急上昇している場合は、攻撃が続いているか、プロセスがCPUを独占している可能性があります。Idfはゆっくりと増加し、通常の操作では最大に近づいています。ハードウェアのアップグレード(または負荷分散)を検討する必要があります。 - file table usage
アクティブに開いているファイルの数。これが最大に達している場合は、プロセスが開いている可能性がありますが、ファイルが適切に解放されていません。 - 負荷平均
システム負荷の要約値を表示します。CPU使用率と相関する必要があります。増加する値は、さまざまなソースから発生する可能性があります。他のグラフとの相関を探します。 - メモリ使用量メモリ
のグラフィック表現。未使用の+キャッシュ+バッファーがたくさんある限り、問題ありません。 - スワップイン/アウト
スワップパーティションのアクティビティを表示します。これは常に0でなければなりません。これに関するアクティビティが表示される場合は、マシンにメモリを追加する必要があります。