タグ付けされた質問 「monitoring」

マシン、システム、ネットワークを監視して問題を発見し、管理者に通知するアプリケーションまたはアプライアンス。

3
インターネット帯域幅を監視する
ネットワークにIPCopファイアウォール/プロキシがインストールされています。iftopを使用して、クライアントがインターネットをどのように使用しているかを確認することもできますが、ntopなどを使用してプロキシの外部から監視することはできますか? ここでは、LANトラフィックには関心がなく、インターネットとの間でやり取りされるトラフィックのみに関心があることに注意してください。

6
既存のネットワークを使いこなす[終了]
閉まっている。この質問は、オフトピック。現在、回答を受け付けていません。 5年前休業。 ロックされています。この質問とトピックへの回答はロックされています。質問はトピックから外れていますが、歴史的に重要です。現在、新しい回答や相互作用を受け入れていません。 私は最近、唯一のIT担当者として会社に参加しましたが、私たちが所有しているソフトウェアとハ​​ードウェア、およびそれらの展開方法を把握するのに苦労しています。限られた時間と予算を念頭に置いて、この情報を見つけて管理するにはどのツールまたはプロセスが効果的ですか?私が探しているものは次のとおりです。 PCとMacを含む約35台のデスクトップ。 AD、Exchange、SQL、およびIISサーバーを含むMicrosoftサーバー。 有線、無線、VPNネットワーク。 私の目標は: 問題を特定して改善します。 正しくライセンスされていることを確認してください。 次の人の仕事を簡単にするのに十分なドキュメント。
10 monitoring 

19
システム管理者として、あなたの仕事に役立つFirefoxプラグインは何ですか?[閉まっている]
閉まっている。この質問は、オフトピック。現在、回答を受け付けていません。 7年前休業。 ロックされています。この質問とトピックへの回答はロックされています。質問はトピックから外れていますが、歴史的に重要です。現在、新しい回答や相互作用を受け入れていません。 開発に欠かせないFirefoxプラグインがいくつかあることは知っています。システム管理、監視などに役立つプラグインは何ですか?システム管理者またはネットワーク管理者としての日常業務を容易にするプラグインはどれですか。



10
1台のコンピューターで複数の画面を監視するにはどうすればよいですか?(教室で言って?)[終了しました]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? サーバー障害のトピックになるように質問を更新します。 6年前休業。 私は小さなコンピュータベースのクラスの教師です。キッドは若いので、各コンピュータの後ろに立って、Itunesやソリティアになっていないことを確認することはできません。 私のコンピューター画面から、小さなボックスで画面のライブフィードを取得する方法があります(画像と画像を考えてください)。これにより、誰が作業していないのか、誰が作業しているのかをすばやく確認できますか?

2
Nagiosを使用してサービスが利用できないことを確認することは妥当ですか?
プライベートインターフェイスとパブリックインターフェイスを備えたサーバーがあるとします。パブリックにはHTTP(S)サーバーなどがあり、プライベートにはMySQLとSSHがあります。 明らかにNagiosは、サービスがそれぞれのインターフェースで実行されていることを確認するのに役立ちます。しかし、MySQLおよびSSHポートがパブリックインターフェイスで開いていないことを明示的にテストするチェックを構築することは良い考えですか?このアイデアは、プライベートである必要のあるサービスを開いた不注意による設定ミスをキャッチし、適切に警告することです。 私の一部は、これはひどくうまくスケールしないだろうという考えを持っています-たとえば、iptables DROPルールがあると想像してください。しかし、そのタイムアウトは、ブロックされたサービスを、本当に行き詰まっているオープンなサービスと区別できるように、十分に長くなければなりません。 これは実用的なアイデアですか?Nagiosは適切なツールですか?私は、TCPチェックプラグインからの結果を無効にする可能性を検討していませんが、それが可能であると確信しています...

2
ディスクがいっぱいになるまでの日数の計算
グラファイトを使用して、ディスク使用率の履歴を経時的に追跡します。アラートシステムは、グラファイトのデータを調べて、空き容量が特定のブロック数を下回ったときにアラートを出します。 よりスマートなアラートを取得したい-私が本当に気にかけているのは、「空き領域について何かをしなければならない前にどれくらいの時間が必要か」ということです。たとえば、トレンドが7日間でディスクがなくなるスペースは警告を発生させ、2日未満の場合はエラーを発生させます。 グラファイトの標準ダッシュボードインターフェイスは、デリバティブとHolt Winters Confidenceバンドでかなりスマートにできますが、これまでのところ、これを実用的なメトリックに変換する方法を見つけていません。他の方法で数値をクランチすることにも問題はありません(グラファイトから生の数値を抽出し、それを実行するスクリプトを実行するだけです)。 複雑な点の1つは、グラフが滑らかではないことです。ファイルは追加および削除されますが、時間の経過に伴う一般的な傾向として、ディスク領域の使用量が増加するため、おそらくローカルミニマム(「ディスク空き」メトリックを参照する場合)を調べる必要があります。 )そして、谷間のトレ​​ンドを描きます。 誰かこれをやったことがありますか?

2
API管理ソリューション[終了]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? サーバー障害のトピックになるように質問を更新します。 6年前休業。 私は現在APIを構築しており、(GUIで)監視してレート制限の使用を可能にするツールを探しています。私はいくつかのエンタープライズソリューションに出くわしました。 http://apigee.com/ http://mashery.com/ http://www.layer7tech.com/ http://www.3scale.net/ Apigeeエンタープライズプランはまさに私が探しているものですが、プランは月額3000ドルから始まり、これは私の価格帯を超えています。他のソリューションはすべて高すぎるか、私が探しているソリューションを提供していません。 これにより、以下を含むいくつかのオープンソースオプションを検討するようになりました。 http://apiaxle.com/ https://code.google.com/p/varnish-apikey/wiki/UsageManual ワニスはかなり完全なソリューションのようです。ただし、データを視覚化するGUIを構築する必要があります。 私の最後のオプションは、EventMachineとrubyを使用してゼロからソリューションを構築することです。 何かアドバイス?

2
RAIDアレイの機能が低下したときに電子メールでアラートを受け取るにはどうすればよいですか?VMware ESXi 5.0、MegaRAID SAS 9260-4i
最近、VMware ESXi 5.0を実行する「ホワイトボックス」サーバーを購入しました(vSphere 5 Essentials Kitを使用する予定です)。VMwareの互換性ガイドによると、サーバーのLSI Logic MegaRAID SAS 9260-4i RAIDコントローラーは互換性があります(「サポートタイプ」は「受信トレイ」としてリストされています)。 ホストにESXi 5.0をインストールするまで、vCenter Server Applianceもインストールしました。vSphere Clientを使用してvCenter Serverに接続しました。「ホストストレージステータス」が変化したときにトリガーされるアラームなど、事前定義されたアラームのリストが表示され、必要なように聞こえます。 RAIDアレイからドライブの1つを引き出してみました(その結果、RAIDコントローラーから予期されるビープ音が鳴りました)が、vCenterで何も起こっていないようです。「ホストストレージステータス」アラームがトリガーされていないようです。 私が本当に必要なことは、RAIDアレイが劣化している場合に電子メールを送信するようにvCenterを構成し、デッドドライブを認識して交換できることを確認することです。アラームがトリガーされない場合でも、それは有望ではありません。 ここで何か不足していますか?私はVMwareやサーバーハードウェアの専門家ではないので、これについて誰に質問すればよいのかさえわかりません。 前もって感謝します!

1
誰かがデフォルトのmuninグラフの「ユースケース」を説明できますか?
muninをインストールすると、デフォルトのプラグインセットがアクティブになります(少なくともubuntuでは)。または、単に実行munin-node-configureして、システムでサポートされているプラ​​グインを特定することもできます。これらのプラグインのほとんどは、単純なデータをプロットします。私の質問はありません(一部のも...多分)データの性質を説明するのではなく、何それはあなたがこれらのグラフに探していることでしょうか? muninをインストールして、派手なグラフを表示するのは簡単です。しかし、グラフがあり、それらを「読み取る」ことができないと、グラフはまったく役に立たなくなります。 私のシステムではデフォルトで有効になっている標準プラグインをリストします。だから、それは長いリストになるでしょう。完全を期すために、理解したいと考えているプラ​​グインをリストし、それが何に使用されていると思うかについて簡単に説明します。私がそれらのいずれかと間違っている場合は、喜んでください。 この質問を3つの部分に分けてみましょう。 データさえわからないプラグイン データは理解しているが、何に注意すべきかわからないプラグイン 理解できると思うプラグイン データさえわからないプラグイン これらには、必ずしもムニンだけを対象としたものではない質問が含まれている場合があります。データを理解しないことは、通常、オペレーティングシステム/ハードウェアに関する基本的な知識にギャップがあることを意味します。 これらは、何が起こっているのかを推測できるだけのプラグインです...これらの「推測」を見たくはありません... デバイスあたりのディスクIO(IO /秒) IOとは何ですか。私はそれが入力/出力を表すことを知っています。しかし、それはそれが行くところです。 デバイスあたりのディスクレイテンシ(平均IO待機)「IO待機」とは何の手掛かりではない... IOサービス時間これは大きな混乱であり、グラフに何かを表示することはほとんど不可能です。 データは理解しているが、何に注意すべきかわからないプラグイン IOStat(ブロック/秒読み取り/書き込み)私は、ここで注意すべきことはスパイクだと思いますか?これは、デバイスが頻繁に使用されていることを意味しますか? 利用可能なエントロピー(バイト)これは乱数生成に重要だと思いますか?なぜこれをグラフ化するのですか?これまでのところ、値は常にほぼ一定でした。 VMStat(実行中/ I / Oスリーププロセス)このプロセスと「プロセス」グラフの違いは何ですか?どちらも実行中/スリープ中のプロセスを示していますが、「プロセス」グラフには詳細が表示されているようです。 デバイスあたりのディスクスループット(バイト/秒の読み取り/書き込み)これと「IOStat」グラフの違いは何ですか? inodeテーブルの使用法このグラフで何を探す必要がありますか? 理解できると思うプラグイン 私はここでいくつかのことを推測します...間違っている場合は修正してください。 ディスク使用率(%)使用されている/残っているディスク容量。これは100%に近づいているので、パーティションのクリーンアップまたは拡張を検討する必要があります。これはルートパーティションにとって非常に重要です。 ファイアウォールスループット(パケット/秒)ファイアウォールを通過するパケットの数。これが長期間スパイクしている場合は、DOS攻撃の兆候である可能性があります(または単に大きなファイルを受信して​​いるだけです)。また、ファイアウォールのパフォーマンスに関する情報も得られます。それが横ばいになり、より多くの「パワー」が必要な場合は、ロードバランシングを検討する必要があります。それが横ばいになり、CPU負荷との相関が見られる場合は、ハードウェアの速度が十分でないことも意味している可能性があります。ディスク使用量との相関は、FW構成での過剰なLOGターゲットを示している可能性があります。 eth0エラー(パケットイン/アウト)ネットワークエラー。この値が増加している場合は、ハードウェアに障害がある可能性があります。 eth0トラフィック(ビット/秒イン/アウト)生のネットワークトラフィック。これはファイアウォールのスループットと相関があるはずです。 スレッド数増加する値は、プロセスがスレッドを適切に閉じていないことを示している可能性があります。調べろ! processesアクティブなプロセス(スリープを含む)の内訳。ここでの急激なスパイクは、フォーク爆弾を示している可能性があります。ゆっくりではあるが増加し続ける値は、アプリケーションがサブプロセスを生成しているが適切に閉じていないことを示している可能性があります。を使用して調査しps fauxます。 プロセスの優先順位これは、プロセスの優先順位の分布を示します。優先度の高いプロセスのみを使用することはあまり役に立ちません。一部の優先順位を下げることを検討してください。 cpuの使用法かなり簡単です。これが急上昇している場合は、攻撃が続いているか、プロセスがCPUを独占している可能性があります。Idfはゆっくりと増加し、通常の操作では最大に近づいています。ハードウェアのアップグレード(または負荷分散)を検討する必要があります。 file table usageアクティブに開いているファイルの数。これが最大に達している場合は、プロセスが開いている可能性がありますが、ファイルが適切に解放されていません。 負荷平均システム負荷の要約値を表示します。CPU使用率と相関する必要があります。増加する値は、さまざまなソースから発生する可能性があります。他のグラフとの相関を探します。 メモリ使用量メモリのグラフィック表現。未使用の+キャッシュ+バッファーがたくさんある限り、問題ありません。 スワップイン/アウトスワップパーティションのアクティビティを表示します。これは常に0でなければなりません。これに関するアクティビティが表示される場合は、マシンにメモリを追加する必要があります。

4
ユーザーごとのSSHトラフィックを監視する
12時間ごとに実行されるバックアップアプリケーションがあります。 複数のサーバー、デスクトップ、ラップトップがEC2インスタンスに接続し、独自のログイン認証情報を使用してSFTP経由でバックアップをプッシュします。 ファイルを回復する必要がある場合は、シンプルなSFTPクライアントを介してファイルを参照し、ファイルを復元できます。これは過去8か月間、非常に順調に稼働しています。 SSH経由でユーザーごとに毎月転送されるデータ数を教えてください。過去8か月間はログは必要ありませんが、今からそれを記録するものは素晴らしいです。 これを可能にするものはありますか? OS:Ubuntu 10.10

6
NagiosグラフソリューションとMunin / Cacti / Ganglia
監視するためのnagiosサーバーのセットアップが30台まであります。トレンドチャートをいくつか追加したいと思います。nagiosのグラフ作成プラグインはシンプルで、多くの人が独立したスタンドアロンのグラフ作成/傾向分析ツールを使用していることを読んだことがあります。 nagiosグラフプラグインとganglia / munin / cactiのようなスタンドアロン製品の制限は何ですか? スタンドアロンパッケージが提供し、nagiosグラフプラグインが提供しない特定の機能と利点に興味があります。


3
LinuxでシステムCPU /システムコールを監視する
システムのCPU時間を大量に消費しているプロセスがいくつかあります(vmstatを確認することで判断)。行われているシステムコールの種類を簡単に確認する方法はありますか? straceがあることは知っていますが、より速くて簡単な方法はありますか?システムコールの「トップ」のようなものはありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.