高負荷平均、低CPU


10

サーバーが遅くなり、その理由がわかりません。

上から印刷:

top - 14:32:50 up 639 days,  6:30,  1 user,  load average: 67.93, 70.63, 79.85
Tasks: 245 total,   1 running, 244 sleeping,   0 stopped,   0 zombie
Cpu(s):  3.9% us,  0.5% sy,  0.0% ni, 94.5% id,  1.0% wa,  0.0% hi,  0.0% si
Mem:   1034784k total,  1021256k used,    13528k free,     4360k buffers
Swap:  1023960k total,   635752k used,   388208k free,    36632k cached

vmstat 10 6

procs -----------memory---------- ---swap-- -----io---- --system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in    cs us sy id wa
 0 110 795604  12328   3980  46676    0    0     0     0    0     0  4  1 95  1
 0 97 788848  12052   3960  46256 2985   33  3323    33  429     0  2  1  0 97
 0 119 782660  13992   4096  45740 2780   14  2995   360  435     0  2  1  1 96
 0 121 775924  15600   3724  42796 3084    0  3443   136  440     0  2  1  0 98
 0 113 769392  13576   3476  41968 3002    0  3458     7  426     0  2  1  0 97
 0 113 762284  12440   3332  34884 3151    0  3553    61  427     0  2  1  0 97

doitprod2:/ var / log#grep -c processor / proc / cpuinfo

2

iostat 2

 tps   Blk_czyt/s   Blk_zapis/s  Blk_czyt   Blk_zapis
sda             166,00      7128,00        52,00      14256        104

了解しました。強制終了してから、一部のプロセスは正常に動作します。とにかくあなたの助けのためのThx。


の出力を含めることができますvmstat 10 6か?(実行には60秒かかります)また、grep -c processor /proc/cpuinfo
ジェームズC

serverfault.com/q/482832/58957の回答/コメントには、これらの症状のさらなる理由と説明が記載されています。
Nickolay 2018

回答:


9

おそらくプロセスはUNINTERRUPTIBLE_SLEEP状態にあります。ディスクからの読み取りなどのハードウェアからの何かを待っているため、通常はその状態にあります。これらのプロセスは事実上スリープ状態です(244のスリーププロセスがあります)が、それらは負荷平均の計算に入ります。でサーバーのIOを確認し、vmstat多くのDステータスがあるtopかどうか、またはps確認する必要があるかどうかを確認します。

編集:vmstat出力を確認すると、IOの問題がさらに確認されます。あなたbの下の列procsの無停電睡眠の100のプロセスの平均を示しています。あなたのbi列(ブロックはブロック・デバイスから読み出した)非常に高く、ならびにsiカラム(メモリは、スワップ/ディスクから読み取ります)。最後に、cpuヘッダーの下のwa列は、CPUがIOの完了を待機するために90%以上を費やしていることを示しています。

IOでこれらの問題が発生している理由を確認する必要があります。サーバーの容量不足、プロセスが乱暴になっているなどの理由が考えられますが、それは間違いなくIOです。


1
iotopapt-get install iotop)を使用して責任者の検索を開始できます。また、通常のトップでは、O(大文字のo)、次にn、Enterを押して、メモリ使用量で並べ替えます。上位のメモリユーザーがすべてのスワッピングを担当している可能性があります。
Eduardo Ivanec

2

それが高くなったら、あなたが上に持っている1.0%waをチェックしてください。スワップファイルをヒットしたため、プロセスがI / Oを待機する可能性があります

cat /proc/sys/fs/file-nr最初の数値が3番目の数値に近いかどうかを確認し ます(開いているファイルと開いているファイルの合計)。

VPSを使用していますか?


/ proc / sys / fs / file-nr 3600 0 102712
カミロス

サーバーで実行しているソフトウェアの種類を共有できれば、おそらくある程度の光が当てられるでしょう。(例:apache、tomcat、glassfishな​​ど)。しかし、確かに、より多くのラム(ダブル以上)はあなたのマシンに素晴らしいブーストを与えるでしょう。
pataroulis 2011

1

vmstatの出力に表示されるiowait(最後の列に「wa」としてリストされている)は非常に高いです。そして、多くのページングが行われています(物理メモリとディスクベースのスワップ間でデータのページが移動しています)。

このマシンは、より多くの物理RAMから恩恵を受けるでしょう。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.