監視ツールとその機能のより包括的なリストについては、このウィキペディアのページをご覧ください。
質問が述べているように、このタスクに使用される最も一般的に使用されるツールは何であり、それらの長所と短所は何ですか?
監視ツールとその機能のより包括的なリストについては、このウィキペディアのページをご覧ください。
質問が述べているように、このタスクに使用される最も一般的に使用されるツールは何であり、それらの長所と短所は何ですか?
回答:
過去にNagiosを使用して成功しました。非常に拡張性が高く(200以上のアドオン)、比較的使いやすく、多くのレポートがあります。ネガティブは初期セットアップです。
CactiはRRDToolの非常に優れたWebベースのフロントエンドであり、非常に便利なグラフと統計情報を提供します。 RRDToolは、複数のシステムからデータを収集し、さまざまな技術データを監視する部分です。
このcacti / RRDToolソリューションを使用して、UnixおよびWindowsシステムを監視しています。負荷、CPU / RAM使用量、HDスペース、ログインしているユーザー、ネットワークトラフィック、実行中のプロセスなど、多くの有用なメトリックを取得します。
サボテンの詳細については、サボテンとはをご覧ください。ページ。
個人的には、Muninは非常に簡単なアーキテクチャであるため、インストールとプラグインの作成が非常に簡単です。あなたが想像できるすべての目的のために、すでに非常に多くのプラグインが存在しているので、最初からプラグインを書く必要さえないでしょう。
また、美しいグラフと(非常に基本的な)アラートを構成するオプションも提供します。
ZABBIX。オープンソースであり、セットアップとカスタマイズがかなり簡単です。zabbixサーバーにフィードするカスタム監視スクリプトがたくさんありますが、そのデータの集中化、適切な表示、通知(電子メール、IM、SMS、Twitterなど)などを処理します。
私は会社でSpiceworksのロールアウトを行ってきましたが、サーバーの監視だけでなく、ネットワーク上の他のすべてを監視するための優れたツールであることがわかりました。
自動インベントリやカスタムモニタリングなどの処理を行って、問題がある場合にメールを送信します(例:プリンターがインクの10%に達しているか、このサーバーのハードドライブに20%があります)。
そのマイナス面は、おそらくコンピューターごとの情報の密度です。誤解しないでください。マシンごとに大量のデータがありますが、サーバーのような多くの統計が必要な場合は、別のツールを使用する必要があります。
編集:ああ、私はそのビジネスモデルはそれが永遠に無料であることに基づいていることを言及しました。
喫煙は、さまざまなサーバーとサービスの可用性をチェックするだけでなく、それらの遅延を追跡しながら、使いやすく、見栄えがよく、グラフをすばやく表示します。
広範な遅延測定プラグインがすぐに利用できます。Perlの知識があれば、エキゾチックなニーズに合わせて独自のPerlを簡単に作成できます。
大規模な設置では、分散測定のためにマスター/スレーブシステムの恩恵を受けます。
高度に設定可能な警告システムは、ユーザーに影響を与えたり、重大な機能停止に発展する前に問題に気付くのに役立ちます。
Smokepingは無料であり、MRTGおよびRRDtoolの作成者であるTobi OetikerによってPerlで記述されたオープンソースソフトウェアです。
OpenNMSは、私が1,000を超えるLinuxマシンを監視するために働いている場所で使用されています。各マシンのハードウェアとそれらで実行されているアプリケーションを監視します。
Zenoss Coreはある程度の用途があります。サーバー、ネットスイッチ、UPSの軽量監視に(約1年間)使用しています。
Zenoss Coreは、受賞歴のあるオープンソースIT監視製品であり、単一の統合ソフトウェアパッケージを通じて、ネットワーク、サーバー、アプリケーションの構成、正常性、パフォーマンスを効果的に管理します。
Nagiosは無料で、多くのプラグインが用意されているので素晴らしいです。ただし、UIと設定は非常に困難です。
pro / con'sの正反対は、Microsoft System Center Operations Manager(SCOM)は無料ではなく、プラグインが少ないですが、セットアップと構成は見事で簡単です。
私が主にマイクロソフトの会社にいた場合、信頼性の要件が非常に高い(つまり、監視を中断する余裕がない)場合、または開発者がそれを使用できるようにする必要がある場合は、SCOMがNagiosよりも推奨されることを認めなければなりません。
私が使用した:
AlertFoxは数週間前から使用しており、非常に満足しています。稼働時間とパフォーマンスをチェックするだけでなく、ショッピングスクリプト、ユーザーログイン、Webサイトのその他の重要な部分をトランザクションスクリプト(iMacrosベース)で監視します。
内部監視(ディスク領域など)にはNagiosを使用します。
Windows担当者、MOMとして。Systems Center Operations Manager(SCOM)へのアップグレードを検討していますが、Windows 2008の展開を開始するまでアップグレードする必要はありません。
私は運用監視アップグレードプロジェクトに参加しています。いくつかの大きなシステムを提示するために、さまざまなベンダーがオンサイトに来て、比較するためにいくつかの安価な代替品を混在させました。
その1つがHypericで、これは無料のオープンソースソリューションとしても利用可能です。提供された機能とカスタムエージェントの拡張性に感銘を受けました。
統計(メモリ使用量、負荷、mysqlアクティビティ、apacheアクティビティなど)を監視するために、Muninを使用します。箱から出してすぐにさまざまな時間間隔(過去24時間、過去7日間、先月、昨年)で多くのことを既に追跡し、グラフをプロットします。プラグインを通じて、さらに多くのものを監視できます。出力は、きれいなグラフを持つHTMLページです。
Muninにはマスター/ノードアーキテクチャがあります。ノードはサーバー上の統計を収集し、マスターはデータを保存し、HTMLとグラフを生成します。
Monitを使用して、実行中のプロセスを追跡し、特定の構成可能な条件(高CPU負荷、高メモリ使用量、HTTP応答なしなど)が発生した場合に再起動または警告します。負荷、メモリ使用量、ハードディスクの状態、ディスク使用量。
Monitは、監視するすべてのサービスまたはハードウェアと、問題が発生した場合の対応方法ごとに構成する必要があります。最も使用されるオプションは、何もしない、警告メールを送信する、またはサービスを再起動することです。
Monitは正常に機能しますが、サービスの開始、停止、または再起動に失敗することがあり、何が問題なのかを示すための診断情報があまりありません。これは、問題がサービスにあるのか、cronのような最小環境で実行されるMonitの構成にあるのかわからないことを意味します。
両方のツールは、ほとんどのLinuxディストリビューションでデフォルトで利用可能です。
誰もLinuxサーバーのlogwatchやlogcheckについて言及していないことに驚いています-ログを読む時間を大幅に節約できます!!
サーバーの監視にPingdomを使用しています。サーバーに到達できない場合、SMSメッセージを送信します。
それはすべて「モニター」の意味に依存します!
CactiおよびRRDToolベースのソリューションとの競合をチェックするための新しい参加者は、Graphite(http://graphite.wikidot.com/)です。
RRDToolは、Whisperと呼ばれるバッキングストアに置き換えられます。このドキュメントは、なぜ異なるのかについてかなり良い概要を示しており、何かを調査するときにアドホックグラフを作成するCLIが本当に好きです。
現在、Paesslerの PRTGを使用しています。素晴らしいです。エージェントは不要で、優れたAjax Webインターフェイス、履歴ロギング、グラフ作成、WMIなどがあります。無料で利用できる10のセンサーバージョンがありますが、エンタープライズバージョンにはいくつかの壮大な機能があります。お金はうまく使いました。
ホビット-これは、Big Brotherのより高速なバージョンです(最近、驚くほど商用化されているようです)。
急いでいて、MSサーバーを監視するクイックツールが必要な場合は、Windowsのパフォーマンスモニターを使用し、カスタム監視テンプレートとカスタムスケジュールを使用してカウンターログを設定します(例:1時間ごとに5分間データを収集します)。次に、MicrosoftのLogParserおよびCodeplexのログのパフォーマンス分析(PAL)ツール(http://pal.codeplex.com/)をダウンロードして、カウンターログを処理します。PALは、問題を解決する可能性のあるドキュメント/ツールへのリンクを含む優れたドキュメント化されたレポートを生成します。
Solarwinds、VMwareサーバーのパフォーマンスタブ、およびカスタムスクリプトを組み合わせて使用します。
Solarwinds Orion Network Performance Monitorは、Windowsシステムで使用するものです。Webサーバーの管理者。いくつかの便利なアプリメトリックが実行されていますが、基本的なボックスレベルのもの(ディスク、ネットワーク、CPU)に関する良い情報があります。
VMwareゲストの場合、パフォーマンスタブが気に入っています。
私のSunサーバーでは、Solarwindsで利用できないものが必要な場合(管理者が追加したものや何を使用していないため)、ミラーの状態、スワップの使用状況などを監視するカスタムスクリプト(通常はPerl)を作成します。
Solarwindsをもっと使いたいのですが、1日でたった26時間しかありません(または、上司はそう信じています)。
Zabbix(http://www.zabbix.com)はNagiosよりも優れており、セットアップが簡単です。
独自の監視ソフトウェアを作成しました。コードは市販のパッケージほど洗練されていませんが、多くの機能は必要ありませんでした。他のパッケージを調査して使用方法を学ぶよりも、独自のパッケージを作成する方が簡単でした。コードは私たちが望んでいることを実行し、簡単に拡張できます。