プロセスのスワップされたすべてのメモリをスワップから引き出します

ディスクに書き込むことなく、プロセスのスワップされたすべてのメモリをスワップからすばやく引き出すにはどうすればよいでしょうか。

質問を必要とする体系的な問題は他の当事者によって処理されているため、この問題のコンテキストは取るに足らないものです。しかし、現在、OpenVZノードのスワップ領域を頻繁に解放しなければならないという問題があり、負荷とIO待機が非常に高くなっています。

多くの場合、スワップは主に、個々のコンテナーで実行されている少数のMySQLおよびclamdプロセスによって消費されます。これらのサービスを再起動すると、スワップが解放され、ノードの問題が解決されますが、明らかな理由により望ましくありません。

ノードが過負荷で現在の方法よりも速いものが必要なときに、これらのプロセスからスワップをすばやく解放する方法を探しています。

unswap(){ [[ $1 && $(ls /proc/$1/maps) ]]  && ((gcore -o /tmp/deleteme $1 &>/dev/null; rm -fv /tmp/deleteme.$1)&) 2>/dev/null  || echo "must provide valid pid";};unswap

このコアダンプにより、すべてのRAMが強制的にアクセスされ、スワップから解放されますが、ファイルへの書き込みを回避する方法はまだ見つけていません。また、現在スワップされているアドレス範囲を分離してその部分を/ dev / nullにダンプできれば、プロセスはより高速になるようですが、それを行う方法はまだ見つけていません。

これは巨大なノードなので、通常のswapoff / swaponメソッドは非常に時間がかかります。また、ノードの構成は私の制御下にないため、根本原因の修正はこの質問の一部ではありません。ただし、何も殺したり、再起動したりせずに、スワップのかなりの部分をすばやく解放できる方法についての洞察は、高く評価されます。

環境：CentOS 6.7 / OpenVZ

後でこれにつまずくかもしれない人のための更新：

Jlongの入力を使用して、次の関数を作成しました。

unswap(){ (awk -F'[ \t-]+' '/^[a-f0-9]*-[a-f0-9]* /{recent="0x"$1" 0x"$2}/Swap:/&&$2>0{print recent}' /proc/$1/smaps | while read astart aend; do gdb --batch --pid $1 -ex "dump memory /dev/null $astart $aend" &>/dev/null; done&)2>/dev/null;};

少し遅いですが、それ以外の場合はここで要求されたとおりに動作します。スワップで最大のアドレス範囲のみを検索し、些細な小さな領域の反復を省略することで速度を改善できるかもしれませんが、前提はしっかりしています。

作業例：

#Find the process with the highest swap use
[~]# grep VmSwap /proc/*/status 2>/dev/null | sort -nk2 | tail -n1 | while read line; do fp=$(echo $line | cut -d: -f1); echo $line" "$(stat --format="%U" $fp)" "$(grep -oP "(?<=NameS).*" $fp); done | column -t
/proc/6225/status:VmSwap:   230700  kB  root  mysqld

#Dump the swapped address ranges and observe the swap use of the proc over time
[~]# unswap(){ (awk -F'[ t-]+' '/^[a-f0-9]*-[a-f0-9]* /{recent="0x"$1" 0x"$2}/Swap:/&&$2>0{print recent}' /proc/$1/smaps | while read astart aend; do gdb --batch --pid $1 -ex "dump memory /dev/null $astart $aend" &>/dev/null; done&)2>/dev/null;}; unswap 6225; while true; do grep VmSwap /proc/6225/status; sleep 1; done
VmSwap:   230700 kB
VmSwap:   230700 kB
VmSwap:   230676 kB
VmSwap:   229824 kB
VmSwap:   227564 kB
... 36 lines omitted for brevity ... 
VmSwap:     9564 kB
VmSwap:     3212 kB
VmSwap:     1876 kB
VmSwap:       44 kB
VmSwap:        0 kB

スワップされたメモリの大きなチャンクのみをバルクダンプするための最終的な解決策：

unswap(){ (awk -F'[ \t-]+' '/^[a-f0-9]*-[a-f0-9]* /{recent="0x"$1" 0x"$2}/Swap:/&&$2>1000{print recent}' /proc/$1/smaps | while read astart aend; do gdb --batch --pid $1 -ex "dump memory /dev/null $astart $aend" &>/dev/null; done&)2>/dev/null;}; grep VmSwap /proc/*/status 2>/dev/null | sort -nk2 | tail -n20 | cut -d/ -f3 | while read line; do unswap $line; done;echo "Dumps Free(m)"; rcount=10; while [[ $rcount -gt 0 ]]; do rcount=$(ps fauxww | grep "dump memory" | grep -v grep | wc -l); echo "$rcount        $(free -m | awk '/Swap/{print $4}')"; sleep 1; done

この方法がプロセスまたはシステムの状態にリスクをもたらすかどうか、特に複数のプロセスを同時にループしている場合はまだ判断していません。これがプロセスまたはシステムに及ぼす可能性のある潜在的な影響について誰かが洞察している場合は、遠慮なくコメントしてください。

— ブランドンデュプリー
ソース

gdbスワップインされるプロセスに多数のスワップされたフラグメントがある場合、「最終的な解決策」は膨大な数の並列インスタンスを起動する可能性があると私は思います。スクリプトはgdb、上位20の最大プロセスのスワップされた（大きな）フラグメントごとにパララーインスタンスを起動します。私は1つが、少なくとも追加すべきだと思う| tail -n20後awkに結果を渡す前にwhile400に制限の最大parallerプロセスにループ

— ミッコRantalainenを

GDBの「メモリのダンプ」コマンドを使用して同じ結果を達成し、/ dev / nullに書き込むことができます。

スワップを解除する必要があるリージョンを/ proc / $ PID / smapsで見つけるだけです。/ proc / $ PID / smapsの例：

02205000-05222000 rw-p 00000000 00:00 0 
Size:              49268 kB
Rss:               15792 kB
Pss:                9854 kB
Shared_Clean:          0 kB
Shared_Dirty:      11876 kB
Private_Clean:         0 kB
Private_Dirty:      3916 kB
Referenced:          564 kB
Anonymous:         15792 kB
AnonHugePages:         0 kB
Swap:              33276 kB
KernelPageSize:        4 kB
MMUPageSize:           4 kB

次に--batchモードを使用してgdbコマンドを実行し、関数で使用できるようにします。

[root@nunya ~]# swapon -s ; gdb --batch --pid 33795 -ex "dump memory /dev/null 0x02205000 0x05222000" ;swapon -s
Filename                Type        Size    Used    Priority
/dev/sda2                               partition   7811068 7808096 -1

[Thread debugging using libthread_db enabled]

Filename                Type        Size    Used    Priority
/dev/sda2                               partition   7811068 7796012 -1

— jlong
ソース

良い考えです。少し後で改善しました。その後、他の人々が数年かけてさらに改善し、github.com

— wiedemannc /