ディスクに書き込むことなく、プロセスのスワップされたすべてのメモリをスワップからすばやく引き出すにはどうすればよいでしょうか。
質問を必要とする体系的な問題は他の当事者によって処理されているため、この問題のコンテキストは取るに足らないものです。しかし、現在、OpenVZノードのスワップ領域を頻繁に解放しなければならないという問題があり、負荷とIO待機が非常に高くなっています。
多くの場合、スワップは主に、個々のコンテナーで実行されている少数のMySQLおよびclamdプロセスによって消費されます。これらのサービスを再起動すると、スワップが解放され、ノードの問題が解決されますが、明らかな理由により望ましくありません。
ノードが過負荷で現在の方法よりも速いものが必要なときに、これらのプロセスからスワップをすばやく解放する方法を探しています。
unswap(){ [[ $1 && $(ls /proc/$1/maps) ]] && ((gcore -o /tmp/deleteme $1 &>/dev/null; rm -fv /tmp/deleteme.$1)&) 2>/dev/null || echo "must provide valid pid";};unswap
このコアダンプにより、すべてのRAMが強制的にアクセスされ、スワップから解放されますが、ファイルへの書き込みを回避する方法はまだ見つけていません。また、現在スワップされているアドレス範囲を分離してその部分を/ dev / nullにダンプできれば、プロセスはより高速になるようですが、それを行う方法はまだ見つけていません。
これは巨大なノードなので、通常のswapoff / swaponメソッドは非常に時間がかかります。また、ノードの構成は私の制御下にないため、根本原因の修正はこの質問の一部ではありません。ただし、何も殺したり、再起動したりせずに、スワップのかなりの部分をすばやく解放できる方法についての洞察は、高く評価されます。
環境:CentOS 6.7 / OpenVZ
後でこれにつまずくかもしれない人のための更新:
Jlongの入力を使用して、次の関数を作成しました。
unswap(){ (awk -F'[ \t-]+' '/^[a-f0-9]*-[a-f0-9]* /{recent="0x"$1" 0x"$2}/Swap:/&&$2>0{print recent}' /proc/$1/smaps | while read astart aend; do gdb --batch --pid $1 -ex "dump memory /dev/null $astart $aend" &>/dev/null; done&)2>/dev/null;};
少し遅いですが、それ以外の場合はここで要求されたとおりに動作します。スワップで最大のアドレス範囲のみを検索し、些細な小さな領域の反復を省略することで速度を改善できるかもしれませんが、前提はしっかりしています。
作業例:
#Find the process with the highest swap use
[~]# grep VmSwap /proc/*/status 2>/dev/null | sort -nk2 | tail -n1 | while read line; do fp=$(echo $line | cut -d: -f1); echo $line" "$(stat --format="%U" $fp)" "$(grep -oP "(?<=NameS).*" $fp); done | column -t
/proc/6225/status:VmSwap: 230700 kB root mysqld
#Dump the swapped address ranges and observe the swap use of the proc over time
[~]# unswap(){ (awk -F'[ t-]+' '/^[a-f0-9]*-[a-f0-9]* /{recent="0x"$1" 0x"$2}/Swap:/&&$2>0{print recent}' /proc/$1/smaps | while read astart aend; do gdb --batch --pid $1 -ex "dump memory /dev/null $astart $aend" &>/dev/null; done&)2>/dev/null;}; unswap 6225; while true; do grep VmSwap /proc/6225/status; sleep 1; done
VmSwap: 230700 kB
VmSwap: 230700 kB
VmSwap: 230676 kB
VmSwap: 229824 kB
VmSwap: 227564 kB
... 36 lines omitted for brevity ...
VmSwap: 9564 kB
VmSwap: 3212 kB
VmSwap: 1876 kB
VmSwap: 44 kB
VmSwap: 0 kB
スワップされたメモリの大きなチャンクのみをバルクダンプするための最終的な解決策:
unswap(){ (awk -F'[ \t-]+' '/^[a-f0-9]*-[a-f0-9]* /{recent="0x"$1" 0x"$2}/Swap:/&&$2>1000{print recent}' /proc/$1/smaps | while read astart aend; do gdb --batch --pid $1 -ex "dump memory /dev/null $astart $aend" &>/dev/null; done&)2>/dev/null;}; grep VmSwap /proc/*/status 2>/dev/null | sort -nk2 | tail -n20 | cut -d/ -f3 | while read line; do unswap $line; done;echo "Dumps Free(m)"; rcount=10; while [[ $rcount -gt 0 ]]; do rcount=$(ps fauxww | grep "dump memory" | grep -v grep | wc -l); echo "$rcount $(free -m | awk '/Swap/{print $4}')"; sleep 1; done
この方法がプロセスまたはシステムの状態にリスクをもたらすかどうか、特に複数のプロセスを同時にループしている場合はまだ判断していません。これがプロセスまたはシステムに及ぼす可能性のある潜在的な影響について誰かが洞察している場合は、遠慮なくコメントしてください。
gdb
スワップインされるプロセスに多数のスワップされたフラグメントがある場合、「最終的な解決策」は膨大な数の並列インスタンスを起動する可能性があると私は思います。スクリプトはgdb
、上位20の最大プロセスのスワップされた(大きな)フラグメントごとにパララーインスタンスを起動します。私は1つが、少なくとも追加すべきだと思う| tail -n20
後awk
に結果を渡す前にwhile
400に制限の最大parallerプロセスにループ