タグ付けされた質問 「monitoring」

マシン、システム、ネットワークを監視して問題を発見し、管理者に通知するアプリケーションまたはアプライアンス。

2
特定のプロセスの.pidファイルを見つける方法
私はmonitをセットアップしていて、与えられたpythonアプリケーションをモニターしたいと思っています。Monitは、プロセスの.pidファイルを調べることでこれを行いますが、これがどこにあるかはわかりません。 また、独自の単純な実行可能ファイルを作成して実行しようとしました。ここでも、.pidファイルが作成された場所がわかりません。 また、すべてのプロセスに.pidファイルがありますか?
15 linux  monitoring  monit  pid 

2
PIDが変更されたときにMonitアラートを無効にする
Monitのpidでプロセスを監視すると、次のようになります。 check process blop with pidfile /.../blop.pid start program = "..." stop program = "..." pidfileが変更されるとアラートを受け取ります。 このアラートを無効にするにはどうすればよいですか?たとえば、プロセスの再起動に失敗したときだけ知りたい場合。

6
Windowsイベントログを受動的に監視するにはどうすればよいですか?
特定のイベントが発生したときに自動的に通知されるように、Windowsイベントログをリモートで監視するにはどうすればよいですか? アクティブな監視ソリューションは多数ありますが、人間の注意または継続的なポーリングが必要です。特定のイベントが発生したときに通知を生成するだけの受動的なソリューションが必要です。

4
帯域幅の使用状況を実際に監視する方法
少数の人がいる小さな(Windows)ネットワークがあります。 BTルーター経由でインターネットにアクセスできます 一般的には問題ありませんが、時折、帯域幅の劇的な損失を経験するようです。 ゾンビPCやトレントソフトウェアを実行しているユーザーに苦しんでいる可能性があります...または、ISPによって何らかの制限が課せられる可能性がありますか? 何が起こっているのか知りたい。 特定のポイントですべての帯域幅を使用している実世界(どのPC上のどのアプリ)を提供するために実行できるシンプルなツールはありますか?

2
短命のTCP接続所有者プロセスを見つける
tcpdumpApacheサーバーへのローカル接続で実行すると、TCP接続が確立され、2秒ごとにすぐに閉じられることがわかりました。これらの原因となっているプロセスを見つけるにはどうすればよいですか?netstat -ctp助けにはならなかった、接続が速すぎ、TIME_WAITのプロセス識別子が表示されない。 それらはhaproxyプローブであることが判明しましたが、これはで確認できstraceましたが、そもそもhaproxyを特定する方法はまだわかりません。


2
Linuxベースのデータセンターで時間ドリフトを検出するための戦略は何ですか?
すべてのLinuxベースのデータセンターで時間ドリフトを検出するための戦略は何ですか?これは、最初に思われるよりも難しい問題です。 時間のずれは特定のアプリケーションに深刻な問題を引き起こす可能性があり、多くの場合、NTPがインストールされていても、次の(およびその他の)理由で失敗する可能性があります。 NTPは、再起動時に自動的に再起動するように正しく設定されていません。 サーバーの設定が正しくないため、サーバーが指すタイムサーバーが到達不能または不正確です。 マスタータイムサーバーに到達できず、すべてのサーバーと同期しているため、信頼できないソースに同期しています。 個々のサーバーがすべて正しいかどうかを検出する方法を教えてください。テストスクリプト/アプリケーションがインストールされているサーバーは正しくない可能性があることに注意してください。
14 linux  monitoring  ntp  time 

6
監視サーバーをどのように監視しますか?
そのため、CentOSでGroundworks(Nagiosを使用)を実行して、さまざまなサーバーとプロセスを監視します。警告または重大な状態になったときに、電子メールとSMSテキストを自動的に送信するように設定しています。通常、これは完全に機能します。ただし、Postfixが電子メールの送信を停止することを決定したサーバーでPostfixに問題が2回発生しました。誰も気付かなかったため、最新の時間は4日間続きました。 それは重要な質問につながります。監視サーバーをどのように監視するのですか?


16
MS Windowsサーバーとそのサービスのリアルタイム監視
監視オフィスには、すべての生産設備を監視する大型HDTVがたくさんあります。 私たちは監視しています: Ciscoルーター HPスイッチ HP Proliantサーバー Windows 2003 IIS SQLサーバー 現時点では 稼働時間/可用性およびアラート送信のためのNagios 帯域幅使用のためのサボテン サーバーパフォーマンスのためにVistaで実行するPerfmon 実際のアプリケーションのパフォーマンスを監視するための、他のツールと独自のカスタムコードの組み合わせ。 これはすべて、Perfmonの部分とは別に問題ありません。つまり、画面にリアルタイムチャートを表示したり、特定のパフォーマンスカウンターをログに記録したりなど、必要なものを提供してくれます。Perfmonを実行しているVista PCを再起動すると(通常はWindows Updateが原因)、すべてのカウンターを再設定するのに時間がかかります-文字通り、オフィスの誰かにとって1時間または2時間分の作業です... いずれかの方法を知っている人は誰でも:1. Perfmonカウンターを追加するスクリプト2.グラフィカル出力とWMI / Windowsカウンターアクセスを備えた別のツール。 ありがとう マイク

4
大規模なログ転送と集約
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け付けていません。 UNIX / Linuxマシンからのログファイルをどのように分析していますか?数百台のサーバーを実行し、それらはすべて直接またはsyslogを介して独自のログファイルを生成します。これらを集約し、重要なイベントを選択するための適切なソリューションを探しています。この問題は、3つのコンポーネントに分類されます。 1)メッセージ転送 古典的な方法は、syslogを使用してメッセージをリモートホストに記録することです。これは、syslogにログインするアプリケーションでは正常に機能しますが、ローカルファイルに書き込むアプリケーションではあまり役に立ちません。この解決策としては、syslogを使用してメッセージを送信するプログラムに接続されたFIFOにアプリケーションをログインさせるか、ローカルファイルをgrepして中央のsyslogホストに出力を送信するものを書き込むことがあります。ただし、syslogにメッセージを取り込むためのツールを作成する手間がかかった場合、syslogよりも柔軟性と信頼性が高いFacebookのScribeのようなものに全体を置き換える方が良いでしょうか? 2)メッセージの集約 ログエントリは、ホストごととサービスごとの2つのタイプのいずれかに分類されるようです。ホストごとのメッセージは、1台のマシンで発生するメッセージです。ディスク障害または疑わしいログインを考えてください。サービスごとのメッセージは、サービスを実行しているホストのほとんどまたはすべてで発生します。たとえば、ApacheがSSIエラーを検出したときを知りたいが、100台のマシンで同じエラーが発生したくない場合です。いずれの場合も、各タイプのメッセージのうち1つだけを表示する必要があります。同じディスクに障害が発生したことを示す10個のメッセージは必要ありません。 これを解決する1つの方法は、同じタイプの複数のメッセージを各ホストで1つに集約し、メッセージを中央サーバーに送信してから、同じ種類のメッセージを1つの全体的なイベントに集約することです。SERはこれを行うことができますが、使用するのは厄介です。数日いじった後でも、基本的な集計のみが機能し、イベントを相関させるためにSERが使用するロジックを常に検索する必要がありました。それは強力ですが、トリッキーなものです:私は、同僚が最短時間で拾って使用できるものが必要です。SERルールはその要件を満たしていません。 3)アラートの生成 興味深いことが起こったときに、管理者にどのように伝えるのですか?グループ受信ボックスにメールしますか?Nagiosに注入しますか? それでは、この問題をどのように解決していますか?私は皿に答えを期待していません。詳細を自分で解決することはできますが、確かに一般的な問題が何であるかについてのいくつかの高レベルの議論は素晴らしいでしょう。現時点では、cronジョブ、syslog、およびイベントを見つけるために他に何を知っているのかというミッシュマッシュを使用しています。これは拡張性、保守性、柔軟性に欠けるので、そうすべきではない多くのものを見逃しています。 更新: Nagiosを既に監視に使用しています。これは、検出されたホスト/サービスのテストなどには最適ですが、ログファイルのスクレイピングにはあまり役立ちません。Nagiosのログプラグインがあることは知っていますが、ホストごとのアラートよりもスケーラブルで階層的なものに興味があります。


1
ディスクスペースを監視するためにmonitをセットアップする方法
サーバーでmonitを使用して、Apacheとmysqlの実行を監視します。 次に、ディスクがいっぱいになった場合にアラートを追加します。私はこれをテスト用に追加しました/etc/monit/monitrc: check device rootfs with path /dev/md0 if space usage > 10% then alert 確認したいパーティションが2つ/あり/varます。 mount /dev/md0 on / type ext3 (rw) /dev/md2 on /var type ext3 (rw) この構成でのディスクスペース以外の便利なチェックは何ですか?

3
etsy / statsdの代替
etsyのstatsdに代わるものはありますか?ダッシュボードに似た完全なソリューションかもしれませんか?私の研究では、独自のSaaSソリューションのみが見つかりました。 知らない人のために:statsdは、UDPを介してアプリとシステムのメトリックを収集し、それらをGraphiteに送信して、多少美しいプロットを生成するデーモンです。利用可能なすべての重要な言語用のAPIがあります。 私は欲しい: サードパーティがデータを収集することなく、サーバーで実行する必要があります システム、Java、Perlの両方からデータを収集できる必要があります 軽量で柔軟でなければなりません FOSS 追加のプログラミングが必要な場合があり、フレームワークのみである場合があります


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.