タグ付けされた質問 「monitoring」

マシン、システム、ネットワークを監視して問題を発見し、管理者に通知するアプリケーションまたはアプライアンス。

6
check_loadに使用する警告とクリティカルの値は何ですか?
現在、私はこれらの値を使用しています: # y = c * p / 100 # y: nagios value # c: number of cores # p: wanted load procent # 4 cores # time 5 minutes 10 minutes 15 minutes # warning: 90% 70% 50% # critical: 100% 80% 60% command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4 しかし、これらの値はほとんどランダムに選択されています。 …

1
htop-I / O待機率を表示する
htopでI / O待機率を表示する方法はありますか?これを有効にする方法が見つかりません。次のリンクには、私が必要とする機能の例があります( "Avg:"行):http : //www.concept47.com/austin_web_developer_blog/sysadmin/something-cool-i-learned-about-htop/ しかしhtop 2.0.2の私のバージョンこれを有効にする方法がわかりません。私はこの情報をiotopや類似のツールから取得できることを知っていますが、この情報をhtopで取得したいと考えています。
13 linux  monitoring  htop 

2
サーバー上のスパマーを検出する
私は最近Undelivered Mail Returned to Sender、1500人の顧客の1人にニュースレターを送信中に1つを受け取りました。私のウェブサイトはダブルオプトイン手順を使用して、ユーザーがニュースレターを明示的に受け取りたいことを確認しています。 エラーメッセージ: smtp; 554 ... Swisscom AG IP: 94.130.34.42, You are not allowed to send us mail. Please refer to xyz.com if you feel this is in error. (受信メールサーバーのメールプロバイダーから)スパムメールの例を受け取りました: Received: from mail.com ([94.130.34.42]) by smtp-27.iol.local with SMTP id itOWeYZ6O42IFitOWe35TR; Tue, 13 Feb 2018 03:54:09 +0100 From: …

1
Monitシステム管理システム用のM / Monitインターフェースの無料代替品[終了]
閉まっている。この質問はトピック外です。現在、回答を受け付けていません。 この質問を改善したいですか? 質問を更新することがありますので、話題のサーバー障害のため。 6年前に閉鎖されました。 私はMonitシステム管理システムが大好きですが、小規模な大学のラボで複数のホストを管理するために使用されるM / Monitインターフェイスを購入するIT予算がありません。Rubyベースのmonittrをチェックアウトした ところ、Djangoの人々が何かを調理していることがわかりました。誰も私が複数のサーバーから情報を引き出すのを助けることができる簡単なラッパーにアドバイスをくれますか? 編集:この質問はどのように重複していますか?監視ツールについては質問していません。私は、過去2週間で、おそらくそれらの半ダースを評価しました。非常に具体的な監視ツールについて、非常に具体的な質問をしています。ewwhiteから受け取ったコメントは不快かもしれないが、それは 有効な観察であったと認める。
12 monit  monitoring 

1
SNMPやWMIポーラーを使用してカスタムメトリックスをAmazon CloudWatchにプッシュする人はいますか?
Amazon CloudWatchには、きちんとしたコンソールと、通知にAmazon SNSを使用するアラームシステムがあります。 もともとは、EC2インスタンスのCPU使用率など、AWSメトリックのみを提供していました。 最近、彼らはカスタム指標を追加しました。CloudWatch REST APIを使用して、独自の任意のメトリックをプッシュできます。 SNMPやWMIを介してさまざまなサーバー(一部はEC2、一部はそうでない)をポーリングし、それらのサンプルをカスタムメトリックとしてCloudWatchにプッシュするエージェントを誰かが使用しようとしたのだろうか?したがって、CloudWatchでは、すべてのメトリックス(AWSとそうでない両方)を1か所にまとめて表示できます。 注:一部の監視ツールはEC2から取得できることを理解しています。EC2は、すべてを1か所にまとめる別の方法であり、さまざまな理由で一部の人より優れている場合があります。しかし、CloudWatchが1つの場所である方法について尋ねています。 誰かがこれをしている場合、エージェントとして何を使用していますか?

5
glusterfsボリュームを監視する方法
Glusterfsは優れた分散ファイルシステムですが、整合性を監視する方法はほとんどありません。サーバーが行き来する可能性があり、レンガが古くなったり失敗したりする可能性があります。 最近、すべてが機能しているように見えたときに奇妙な失敗がありましたが、ボリュームから1つのレンガが落ちました(純粋な偶然によって発見されました)。 GlusterFS 3.2ボリュームの正常性状態を知らせるシンプルで信頼できる方法(cronスクリプト?)はありますか?

5
Windowsでミラーディスクの状態をどのように監視しますか?
Windows 2003 Serverにミラー化されたダイナミックディスクがあります。ボリュームの状態をどのように監視しますか? ボリュームに問題があるときにサーバーにメールを送信させる方法はありますか?サーバーでSMARTテストを実行する方法はありますか? 編集: WTFがクライアントサーバーにログインし、DISKPART LIST VOLUMEを実行してこれを確認することはありません。 Volume ### Ltr Label Fs Type Size Status Info ---------- --- ----------- ----- ---------- ------- --------- -------- Volume 0 X xDrive NTFS Mirror 233 GB Failed Rd Volume 1 C NTFS Simple 57 GB Healthy System Volume 2 D DVD-ROM 0 B …

9
古いサーバーを廃止する必要があります
サーバーは正常に動作していますが、5年以上経過しています。彼らはまだ完璧に仕事をしており、サーバーをアップグレードしてもメリットはありません。永久に稼働させておくべきですか、それともサーバーまたはその一部を新しいハードウェアと交換するメンテナンスをスケジュールすべきですか?サーバーに障害が発生すると、データの損失が発生し、定期的なメンテナンスよりも多くのダウンタイムが発生する可能性があります。これらのサーバーは、オンラインのPOS、会計、CRM、および管理情報に使用されます。 サーバーが遠隔地にあるため、ファンの交換やほこりの掃除などの予防保守は不可能です。 また、故障率の経時的な「バスタブ曲線」にも留意してください。新しいハードウェアは、しばらく焼き付けられたハードウェアよりも故障する可能性が高くなります。 長い間トラブルのないサーバーに非常に満足しているクライアントに、古すぎるので交換するためにお金を費やさなければならないことをどのように伝えますか? 最後に、電圧、温度、ファン速度など、リモートで実行できるハードウェアの問題を監視するツールはありますか?

1
一般的なWQLモニタリングクエリ
典型的なWindowsのボトルネックを監視するためにどのWQLクエリを使用しますか?「top」または「netstat」に似たデータを取得するには、どちらを使用しますか?どの間隔でポーリングしますか? ここに私が役に立つと思ういくつかがあります。 SELECT PercentDiskTime, AvgDiskQueueLength, DiskReadBytesPerSec, DiskWriteBytesPerSec FROM Win32_PerfFormattedData_PerfDisk_PhysicalDisk SELECT Caption, CommittedBytes, AvailableBytes, PercentCommittedBytesInUse, PagesPerSec, PageFaultsPerSec FROM Win32_PerfFormattedData_PerfOS_Memory SELECT PercentProcessorTime FROM Win32_PerfFormattedData_PerfOS_Processor SELECT Caption, WorkingSet, PageFaultsPerSec,IOReadBytesPerSec, IOWriteBytesPerSec, ThreadCount, HandleCount FROM Win32_PerfFormattedData_PerfProc_Process SELECT Caption, BytesReceivedPerSec, BytesSentPerSec FROM Win32_PerfFormattedData_Tcpip_NetworkInterface
12 monitoring  wmi 

2
地理的に分散した、フォールトトレラントで「インテリジェントな」アプリケーション/ホスト監視システム
ご挨拶、 分散監視システムに関する集団の意見と見解を尋ねたいのですが、何を使用し、どのボックスが私のボックスにチェックマークを入れるのかを知っていますか? 要件は非常に複雑です。 単一障害点はありません。本当に。私は真剣です!「マスター」と「ワーカー」の両方の単一/複数ノード障害に耐えられる必要があり、監視場所(「サイト」)に複数のノードが存在しないか、同じネットワーク上にあると想定できます。したがって、これはおそらく、DRBDやキープアライブなどの従来のHA技術を排除します。 分散ロジック、複数のネットワーク、複数のデータセンター内、複数の大陸に5つ以上のノードを展開したいと思います。顧客の視点からのネットワークとアプリケーションの「鳥の目」ビュー、50以上のノード、さらには500以上のノードがある場合でも、監視ロジックが動かなくなることのないボーナスポイントが必要です。 球場の数値では1500〜2500のホストとホストあたり30のサービスを想定しているため、かなり合理的な数のホスト/サービスチェック、la Nagiosを処理できる必要があります。監視ノードを追加することで比較的直線的にスケーリングできるようになり、5年後には5000ホストとホストあたり40サービスを監視できるようになると思います。上記の「分散ロジック」についてのメモに追加して、次のように言ってください。 通常の状況では、これらのチェックは監視ノードの$ nまたはn%で実行する必要があります。 障害が検出された場合、ノードの別の$ nまたはn%でチェックを実行し、結果を相関させてから、それらを使用して、アラートを発行する基準が満たされているかどうかを判断します。 グラフと管理しやすい機能。SLAを追跡し、「高可用性」アプリケーションが24時間365日稼働しているかどうかを知る必要があります。理想的には、提案されたソリューションは最小限の労力で「箱から出して」報告する必要があります。 オーダーメイドチェックを開発するための堅牢なAPIまたはプラグインシステムが必要です。 アラートについて賢明である必要があります。1つの監視ノードがコアルーターがダウンしていることを認識していることを(SMSを介して、午前3時に!)必ずしも知りたくありません。私はないそれらの定義された割合があれば知りたい同意何かファンキーが起こっていること。)基本的に私はおよそここで話していることは、「定足数」の論理、または分散狂気への正気のアプリケーションです! 私は商用とオープンソースの両方のオプションを検討したいと思いますが、数百万ポンドかかるソフトウェアを避けたいと思います:-)また、これらすべてのボックスをチェックするものが何もないかもしれないことを受け入れます集団にそれを尋ねたかった。 ノードとその配置を監視することを考えるとき、これらのほとんどはランダムISPネットワーク上の専用サーバーであり、そのため主に私の制御範囲外になることに留意してください。BGPフィードやその他の複雑なネットワークのふるまいに依存するソリューションはおそらく適切ではありません。 また、Nagios、Zabbix、友人など、過去のほとんどのオープンソースのフレーバーを評価、展開、または頻繁に使用/カスタマイズしたことも指摘しておく必要があります。特に、私の質問で説明されているロジックと「インテリジェント」アラートに関して。 必要な点を明確にしてください。乾杯のみんなとギャル:-)
12 monitoring  nagios  sla 

17
MySQL監視ツール
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 MySQLサーバーインスタンスの状態を監視するためにどのツールを使用しますか?無料ですか、それとも商用ですか?
12 mysql  monitoring 

6
SNMPを使用してWindowsサーバーを監視する
これはどれほど難しいのでしょうか?リモートのWin 2k3マシンから現在のCPUパフォーマンスを取得したい。マシンはファイアウォールの内側にあるため、SNMPを使用する必要があります。 仮定: ネットワーキングを理解している/あらゆる種類のIPアドレス/ポートフォワーディング/ファイアウォール/ものを設定できます。 SNMPを理解している-ツールを使用してターゲットマシンのOIDから値を取得する方法を知っています。 SNMPリクエストの結果をどう処理するかを知っています。 Windows ServerでSNMPを有効にし、関連するIPセキュリティ/コミュニティのものを構成しました。 SNMPを使用して、Windowsサーバーの標準的なものに、ディスクやネットワークインターフェイスの数などを尋ねることができます。 質問:-現在のパフォーマンスの使用状況を単に尋ねるために使用したOIDは何ですか。 私は何時間もGoogleに質問してきました-間違った質問を明確に質問します:S ....これはどれほど難しいでしょうか?

8
NagiosとOpen NMSの主な違いは?
私はマネージャーに包括的な監視システムを提案したいと考えており、OpenNMSを検討しています。しかし、私はここでナギオスの熱烈な賞賛を見てきました。彼らの焦点は異なりますか、それとも単に競争相手ですか? ある程度の背景があれば、6つのオンサイトサーバー(ファイルサーバー、PBX、プロキシ、アプリケーションなど)と2つのオフサイトサーバー(Webサイト/開発)をいくつかのスイッチとルーターと共に実行します。インストールする監視サービスは、freeBSDを実行する別の変換されたデスクトップで実行されます。私たちのものはすべて、LinuxまたはBSD派生物を実行します。 私たちはこれを実装するためにお金を使わないことを探しています(ため息)。 助けてくれてありがとう。 編集 openNMSは、私が望むものに近い、より包括的なソリューションを提供するようです。ただし、Javaで記述されており、ポートがまだ公式のポートツリーにないため、拒否されました。NagiosがMRTGキャンペーンよりも優れているようになりました。迅速な対応をありがとう。 -機会

5
Salt(Saltstack)は、Graphite、Ganglia、またはZenossのデータを収集して中継できますか?
新しいプロジェクトを開始し、AnsibleまたはSaltを使用して展開の自動化を検討しています。おそらく、より洗練されたオーケストレーション(サーバー管理とフェデレーション)を検討しています。 Saltを使用する場合、Salt 0mq接続を使用して、Saltの「ミニオン」からMonitoring / Graphingデータベース/コレクターにデータを中継するために、Salt 0mq接続を使用して、SiteとGraphite、Zenoss、またはGangliaの間に統合があるかどうか疑問に思っています。 他の誰かがこれを見ましたか?

2
MonitはApacheを監視対象外としてリストします
monitのドキュメントに従ってmonitをインストールして構成しました。Apache以外のすべてのサービスは実行中としてリストされていますが、ApacheはNot Monitoredと表示しています。 monitの設定に関連する行は次のとおりです。 check process apache with pidfile /var/run/httpd.pid group www start program = "/etc/init.d/httpd start" stop program = "/etc/init.d/httpd stop" if failed host localhost port 80 protocol http then restart if 5 restarts within 5 cycles then timeout サーバーからhttp:// localhost / server-statusおよびhttp:// localhostにアクセスできます。MonitはApacheの監視モードをアクティブとしてリストします。 サーバーはCentOS 5.4を実行しています。 親httpdサーバーのPIDファイルは正しい: [server ~]$ cat …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.