タグ付けされた質問 「performance-monitoring」

サーバーのハードウェアとソフトウェアのパフォーマンス、またはネットワークのパフォーマンスの監視に関する質問。

5
Hyper-VホストでI / Oを実行するVMの決定
Hyper-Vで見られるI / OIの大部分をどのVMが担当しているかを調べるにはどうすればよいですか? 状況:多数のVM(ホストごとに約30)を備えたHyper-Vホストがあり、ディスクの使用率が高い状態が長時間続くことがあります。どのVMがこれを引き起こしているのか知りたい。 Process Explorerを使用してみましたが、Hyper-Vに関連するすべてのI / Oが「システム」プロセスによって処理されることが報告されたため、そこでは何の助けもありません。 アクセスされたファイルごとに分類することは既に役立ちます。Windows Serverの完全なGUIインストールには、この情報を提供するリソースモニターがあります。ただし、ResmonはCoreおよびHyper-Vインストールでは使用できないようです。

2
キャラクターデバイス(テープドライブなど)のパフォーマンスをどのように監視しますか?
ブロックデバイスのパフォーマンスを監視する方法は多数あります。dstatおよびiostat、heck、sarでさえ、ブロックデバイスのI / Oレートに関するデータを提供します。残念ながら、テープドライブなどのキャラクターデバイスのパフォーマンスを監視するための優れたツールはありません。 事前に覚えておくとパフォーマンスを監視するツール(pv、dd + SIGUSR1、おそらくその他)があることは知っていますが、パフォーマンスに応じて3時間または30時間になる可能性のある仕事に2時間かかります。そして、あなたはそれがどれなのか分かりません。 私が考えることができる唯一のことは、おそらくタイムスタンプを使用して、書き込まれたバイトの出力を解析するstraceなどの精巧な使用です。忘れてしまった、または聞いたことがない、よく使用されるツールはありますか?

5
Linuxで多くのコンテキストスイッチを生成しているタスクを調べる
vmstatによると、私のLinuxサーバー(2xCore2 Duo 2.5 GHz)は毎秒約2万のコンテキスト切り替えを常に実行しています。 # vmstat 3 procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu---- r b swpd free buff cache si so bi bo in cs us sy id wa 2 0 7292 249472 82340 2291972 0 0 0 0 0 0 7 13 79 0 0 0 7292 251808 82344 …

6
キャパシティプランニングのための正確なトレンドのランダムI / Oパフォーマンス
私が働いている場所には、Xen Hypervisorを使用して多くの仮想マシンをホストするために使用される多数の「ビッグアイアン」サーバーがあります。これらは通常、32GB RAM、デュアルクアッドコアプロセス、および大量のI / O容量を持つ高速ディスクで構成されます。 私たちは、既存のハードウェア構成が歯の中で少し長くなりつつあり、外に出て、より大きく、より速く、より光沢のある新しいハードウェアを調達する時が来ました。 前述のように、既存のキットは32GB RAMで展開されており、ホストに展開できるVMの数を事実上制限しています。 ただし、新しいハードウェアの調査では、単一のシャーシ内に64、72、または96GBのRAMを搭載した単一のマシン内でより多くのRAMを取得できることは明らかです。明らかに、これにより、指定されたホストにより多くのマシンを追加することができ、常に勝ちです。これまでに完了した分析は、制限要因がディスクサブシステムにシフトされることを示唆しています。 問題は、現在、どこにいるかを把握しようとしていることです...使用法のおかげで、I / O帯域幅、つまり、ランダムなI / O操作は完了できます。このポイントに達すると、iowaitは空ロケットになり、マシンのパフォーマンス全体が犬に行きます。 これは私が尋ねている質問の核心です、特に完了しているランダムI / O操作の数に関連して、既存のI / Oパフォーマンスを正確に追跡/追跡する方法を知っている人はいますか? 私が実際にメトリックを取得しようとしているのは、「この構成はX個のランダムI / O要求を正常に処理でき、現在(平均して)Z個の操作のピークでY個の操作を実行しています」です。 前もって感謝します!

2
次のvmstat出力をどのように解釈しますか?
次の5台のマシン(c、h、j、s、およびuという名前)とそれぞれのvmstat 1出力を検討します。 vmstatの出力から情報が与えられた場合: どのマシンが良い状態だと思いますか?どうして?あなたの推論は何ですか? どのマシンが悪い状態にあると考えますか?どうして?あなたの推論は何ですか?どのように修正しますか?メモリ、CPU、IOサブシステムなどをアップグレードしますか? vmstat出力を解釈するための直感的な感覚を得る方法を学ぼうとしています。 マシンc: # vmstat 1 procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------ r b swpd free buff cache si so bi bo in cs us sy id wa st 1 0 4 9456 10692 304020 0 0 193 92 310 131 7 1 80 11 2 …

5
WMI経由で利用できるWindowsの「負荷平均」に最も近いものは何ですか?
Linuxには、次のように定義される負荷平均の概念があります。 システム負荷平均は、実行可能な状態または中断できない状態にあるプロセスの平均数です。実行可能な状態のプロセスは、CPUを使用しているか、CPUの使用を待機しています。割り込み不可能な状態のプロセスは、ディスクを待つなど、I / Oアクセスを待っています。平均は、3つの時間間隔で取得されます。負荷平均はシステム内のCPU数に対して正規化されていないため、1の負荷平均は常に1つのCPUシステムが読み込まれることを意味しますが、4 CPUシステムでは75%の時間アイドル状態でした。 WMI経由で利用できる最も近いものは何ですか?基本的に、そのようなパフォーマンスメトリックの測定方法を決定する2つのOSの間に違いはありますか?違いは何ですか?


7
リモートLinuxサーバーでCPU使用率をグラフ化するための簡単なオプション
私の要件は非常に簡単です。リモートLinuxサーバーのCPU使用率をグラフ化する必要があります。私は複雑なものを探しているのではなく、LinuxサーバーのCPU使用率を1週間にわたってプロットできる必要があるだけです。 私はサボテンのルートを下り始めました-簡単ではありません、それは簡単ではなく、間違いなくやり過ぎのように感じます。 より簡単で、より速く、より簡単なオプションはありますか?


2
NFS I / Oモニタリング
NFSマウントされたディレクトリがあり、そのI / O使用状況(MB /秒の読み取りと書き込み)を監視したいと思います。それを行うための推奨される方法は何ですか? これはNFSクライアントです。NFSサーバーにアクセスできません。私は一般的なI / Oの使用法には興味がありません(そうでなければ、vmstat / iostatを使用します)。また、複数のNFSマウントがあります。特定のマウントを1つだけ監視することに興味があります(または、etherealを使用した可能性があります)。 ありがとう!


7
バックアップなどを監視し、そのデータから統計をトレンド化するための最適なツール[終了]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? サーバー障害のトピックになるように質問を更新します。 6年前休業。 私はnagios、opennms、およびzenossについていくつかの調査を行いましたが、探しているものが見つかったことを確信していません。 今の私の主な原動力は、バックアップを監視できることです。これには、mysql、mssql、および最終的にいくつかのファイルシステムバックアップが含まれます。 これらのさまざまなシステムのバックアッププロセスをラップし、統計を収集するツールがあります。したがって、次のようなアイテム: バックアップされたデータベースの数 dbバックアップファイルのサイズ 圧縮されたdbバックアップファイルのサイズ バックアップを作成する時間 ファイルを圧縮する時間 A)ジョブがスケジュールに従って実行されない場合に通知を受け取ることができるようにしたいB)通知をトリガーする統計にしきい値を設定できるようにするC)統計を傾向およびグラフ化できるようにしたい この情報をHTTP POSTを介して監視アプリケーションに送信することを計画しています。または、監視アプリケーションがログファイルからそれをプルすることもできます。 ただし、他の「監視」の観点から(監視システムの観点から)「静的」な他のプロセスがあるため、柔軟性が非常に重要です。 1つまたは複数のツールは、ネットワークインターフェイス、サーバー負荷などの一般的な監視と傾向分析も実行できる必要があります。バックアップ監視を実施したら、これらの項目も含める必要があります。 ありがとう。 フォローアップ: 私は次のことをこの順序で試すことにしました。 Zabbix:他のものより「ワンストップショップ」のように見え、Ubuntu Lucid RCに簡単にインストールできました opsview Nagios w / nagvis、pnp4nagios、nagiosgraph npcプラグイン付きサボテン ムニン:シンプルさを少し傷つけたが、これは長い目で見れば祝福になるかもしれない 私が決定したらポストバックします、それが起こるまでにはしばらくかかるかもしれません。

2
Windows Server 2012でディスク使用量グラフを表示する方法
サーバーで大幅なスローダウンが発生します。そして、検査すればするほど、そこで何が起こっているのかを見つけることが少なくなります。 I / Oに関係しているのではないかと思います。ローカルPCでタスクマネージャーを開くと、ディスクの使用状況を確認できます。 しかし、サーバーでは、使用中のディスクの量とボトルネックになるかどうかを確認する(できれば簡単な)方法を見つけることができません。 Windows Server 2012でのディスク使用量をどのように確認しますか?

6
サーバーはどの時点でアイドル状態と見なされますか?
概念的に、アイドル状態のサーバーの定義は何ですか? サーバーがアイドル状態であるかどうかを判断するために、どのリソースメトリックを確認しますか? あなたは見ますか: CPU使用率 ディスクの使用状況 メモリ使用量 もしそうなら、何かがアイドル状態であるかどうかを決定するために、これらはどのしきい値になければなりませんか? これらの統計を純粋に見ると、リブートしてパッチを適用すると結果が歪むでしょう。

1
Windows / NTFS-ファイル操作の完了時間を測定することは可能ですか?
NTFSドライバーに発行されたファイル操作(ファイルを開く、ファイルを削除、ファイルを削除、書き込み、読み取りなど)を完了してログに記録するのにかかる時間を測定できる可能性を探しています。アプリ内で時間を計測するようにアプリを変更できません。呼び出しを発行してからアプリケーションの実行に戻るまでの時間に興味があります。 アプリケーションは、iSCSIストレージに配置されたNTFSボリュームに継続的に書き込みます。また、最も古いファイルを定期的に削除しています。ファイルサイズは100〜200 MBです。ボリュームには常に約10%の空き領域があります。ある時点で、アプリケーションはデータを定期的に書き込むことができないため、メモリ内のバッファリングを開始します。その後、何かが起こり、バッファが空になり始め、すべてが通常に戻ります。 物理ボリュームと論理ボリュームの両方へのI / O操作をテストしました-「停止」中に異常は見られません 次に、問題がアプリケーション内にあるのか、OSのどこにあるのかを調べたいと思います。そのため、すべてのファイル操作のタイミングをログに記録できるかどうか、通常よりも時間がかかるシステムか、操作が速く、アプリケーション内で何かがブロックされているかどうかを判断できると考えていました。 プラットフォームは64ビットWindows Server 2008R2です。sysinternalsプロセスモニターを試しましたが、実行時間のログが記録されません。問題が発生するまで数時間かかる場合があります。 この仕事に適したツールを提案できますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.