Pythonプロセスで使用される合計メモリ?


266

Pythonプログラムが現在使用しているメモリの量を判別する方法はありますか?単一のオブジェクトのメモリ使用量についての議論を見てきましたが、必要なのはプロセスの合計メモリ使用量です。これにより、キャッシュされたデータの破棄を開始する必要がある時期を判断できます。

回答:


303

Linux、Windows 7などのさまざまなオペレーティングシステムで機能する便利なソリューションを次に示します。

import os
import psutil
process = psutil.Process(os.getpid())
print(process.memory_info().rss)  # in bytes 

現在のPython 2.7をpsutil 5.6.3でインストールすると、最後の行は次のようになります。

print(process.memory_info()[0])

代わりに(APIに変更がありました)。

注:pip install psutilまだインストールされていない場合は、実行してください。


3
psutilクロスプラットフォームであり、psコマンドラインツールと同じ値を返すことができます:pythonhosted.org/psutil/#psutil.Process.memory_info
amos

1
「(psutil)は現在、32ビットと64ビットの両方のアーキテクチャで、Linux、Windows、OSX、FreeBSD、Sun Solarisをサポートしています。Pythonのバージョンは2.6から3.4です。ドキュメント
Cecilia

2
この数値がプロセスエクスプローラーの数値と一致しないのはなぜですか?psutilからの数は常に約10%大きいようです。
wordsthewise

39
psutilは標準ライブラリに含まれていないことに注意してください
grisaitis

12
の最近のバージョンではpsutilpsutil.Process()はと同等psutil.Process(os.getpid())です。それはあなたがタイプすることを覚えておく必要がある一つ少ないことです。
rnorris

208

Unixベースのシステム(Linux、Mac OS X、Solaris)ではgetrusage()、標準ライブラリモジュールの関数を使用できますresource。結果のオブジェクトには属性ru_maxrssがあり、呼び出しプロセスのピークメモリ使用量を示します。

>>> resource.getrusage(resource.RUSAGE_SELF).ru_maxrss
2656  # peak memory usage (kilobytes on Linux, bytes on OS X)

Pythonのドキュメントは、ユニットをメモしておきません。特定のシステムのman getrusage.2ページを参照して、値の単位を確認してください。Ubuntu 18.04では、単位はキロバイトとして表記されます。Mac OS Xでは、バイトです。

このgetrusage()関数はresource.RUSAGE_CHILDREN、子プロセスの使用状況を取得するために指定したり、(一部のシステムでは)resource.RUSAGE_BOTH合計(自己および子)プロセスの使用状況を取得したりすることもできます。

あなたが唯一のLinuxを気にする場合は、代わりに読むことができる/proc/self/statusか、/proc/self/statmこの質問およびのために他の回答に記載されたファイルこのあまりに1。


2
わかりました。SOに質問をマージするためのプロセスがあるかどうか、または何かについてはわかりませんでした。重複した投稿の一部は、両方の質問に標準のライブラリソリューションがあることを人々に示すためでした...そして一部は担当者のためです。;)この回答を削除する必要がありますか?
Nathan Craike、2011年

6
Mac OSは間違いなくRSSをバイトで返し、Linuxはキロバイトで返します。
Neil、

13
単位はキロバイトではありません。これはプラットフォームに依存するため、調べるにはresource.getpagesize()を使用する必要があります。与えられたPythonのドキュメント(docs.python.org/2/library/resource.html#resource-usage)は、実際には非常に明確です。私の箱では4096です。
Ben Lin、

5
@BenLinこれらのPythonドキュメントは明らかに間違っているか、Macバージョンにバグがあります。getrusageによって使用される単位とgetpagesizeによって返される値は明らかに異なります。
Andrew

6
現在の使用法を尋ねる質問。これは最大使用量であることに注意してください。(それでも有用な答えですが、誤ってコピーして貼り付けた人に警告するだけです。)
Luc

65

Windowsでは、WMI(ホームページチーズショップ)を使用できます。


def memory():
    import os
    from wmi import WMI
    w = WMI('.')
    result = w.query("SELECT WorkingSet FROM Win32_PerfRawData_PerfProc_Process WHERE IDProcess=%d" % os.getpid())
    return int(result[0].WorkingSet)

Linuxの場合(pythonクックブックhttp://code.activestate.com/recipes/286222/から:

import os
_proc_status = '/proc/%d/status' % os.getpid()

_scale = {'kB': 1024.0, 'mB': 1024.0*1024.0,
          'KB': 1024.0, 'MB': 1024.0*1024.0}

def _VmB(VmKey):
    '''Private.
    '''
    global _proc_status, _scale
     # get pseudo file  /proc/<pid>/status
    try:
        t = open(_proc_status)
        v = t.read()
        t.close()
    except:
        return 0.0  # non-Linux?
     # get VmKey line e.g. 'VmRSS:  9999  kB\n ...'
    i = v.index(VmKey)
    v = v[i:].split(None, 3)  # whitespace
    if len(v) < 3:
        return 0.0  # invalid format?
     # convert Vm value to bytes
    return float(v[1]) * _scale[v[2]]


def memory(since=0.0):
    '''Return memory usage in bytes.
    '''
    return _VmB('VmSize:') - since


def resident(since=0.0):
    '''Return resident memory usage in bytes.
    '''
    return _VmB('VmRSS:') - since


def stacksize(since=0.0):
    '''Return stack size in bytes.
    '''
    return _VmB('VmStk:') - since

14
Windowsコードが動作しません。この変更はありません:return int(result[0].WorkingSet)
ジョンFouhy

1
John Fouhyのコメントを変更した後でも、このWindowsコードはWindows 7 x64では動作しません。
Basj 2014

私にはこのエラーがあります:return [ wmi_object(obj、instance_of、fields)for obj in self._raw_query(wql)] File "C:\ Python27 \ lib \ site-packages \ win32com \ client \ util.py"、line 84、次のリターンで_get_good_object_(self._iter .next()、resultCLSID = self.resultCLSID)pywintypes.com_error:(-2147217385、 'OLE error 0x80041017'、None、None)誰かが私を助けることができるなら?私は8 x64を獲得していますが、x32ではpython
Radu Vlad

注:wmiモジュールの(最新の)ソースを調べた後、John Fouhyの提案に従ってWindowsの例を更新しました。(1)(2)も参照してください。
jedwards 2016年

33

UNIXでは、psツールを使用してそれを監視できます。

$ ps u -p 1347 | awk '{sum=sum+$6}; END {print sum/1024}'

1347はプロセスIDです。また、結果はMB単位です。


8

インポートなしのPython 2、Python 3pypyのLinuxでの現在のプロセスの現在のメモリ使用量:

def getCurrentMemoryUsage():
    ''' Memory usage in kB '''

    with open('/proc/self/status') as f:
        memusage = f.read().split('VmRSS:')[1].split('\n')[0][:-3]

    return int(memusage.strip())

現在のプロセスのステータスファイルを読み取り、の後VmRSS:にすべてを取り、次に最初の改行の前にすべてを取り(VmRSSの値を分離)、最後にスペースと単位(kB)である最後の3バイトを切り取ります。
返すには、空白を取り除き、数値として返します。

Linux 4.4および4.9でテスト済みですが、初期のLinuxバージョンでも機能するはずです。ファイルman procの情報を探して検索すると、/proc/$PID/status一部のフィールドの最小バージョン(「VmPTE」のLinux 2.6.10など)が表示されますが、「VmRSS "フィールド(ここで使用)にはそのような言及はありません。したがって、私はそれが初期バージョンからそこにあったと思います。


5

私はそれが好きです、@ bayerをありがとう。現在、特定のプロセスカウントツールを取得しています。

# Megabyte.
$ ps aux | grep python | awk '{sum=sum+$6}; END {print sum/1024 " MB"}'
87.9492 MB

# Byte.
$ ps aux | grep python | awk '{sum=sum+$6}; END {print sum " KB"}'
90064 KB

プロセスリストを添付します。

$ ps aux  | grep python
root       943  0.0  0.1  53252  9524 ?        Ss   Aug19  52:01 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
root       950  0.6  0.4 299680 34220 ?        Sl   Aug19 568:52 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
root      3803  0.2  0.4 315692 36576 ?        S    12:43   0:54 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
jonny    23325  0.0  0.1  47460  9076 pts/0    S+   17:40   0:00 python
jonny    24651  0.0  0.0  13076   924 pts/4    S+   18:06   0:00 grep python

参照


マルチパイプを回避するためのコードの最適化ps aux | awk '/python/{sum+=$6}; END {print sum/1024 " MB"}'
NeronLeVelu

4

Python 3.6およびpsutil 5.4.5の場合、ここにmemory_percent()リストされている関数を使用する方が簡単です

import os
import psutil
process = psutil.Process(os.getpid())
print(process.memory_percent())

1
これにはlib psutilが必要です
confiq

4

よりも使いやすい/proc/self/status/proc/self/statm。これは、スペースで区切られたいくつかの統計のリストです。両方のファイルが常に存在するかどうかを確認できませんでした。

/ proc / [pid] / statm

ページ単位で測定されたメモリ使用量に関する情報を提供します。列は次のとおりです。

  • size(1)プログラムの合計サイズ(/ proc / [pid] / statusのVmSizeと同じ)
  • 常駐(2)常駐セットサイズ(/ proc / [pid] / statusのVmRSSと同じ)
  • shared(3)常駐共有ページの数(つまり、ファイルによってバッキングされる)(/ proc / [pid] / statusのRssFile + RssShmemと同じ)
  • テキスト(4)テキスト(コード)
  • lib(5)ライブラリ(Linux 2.6以降は使用されず、常に0)
  • データ(6)データ+スタック
  • dt(7)ダーティページ(Linux 2.6以降は使用されず、常に0)

以下に簡単な例を示します。

from pathlib import Path
from resource import getpagesize

PAGESIZE = getpagesize()
PATH = Path('/proc/self/statm')


def get_resident_set_size() -> int:
    """Return the current resident set size in bytes."""
    # statm columns are: size resident shared text lib data dt
    statm = PATH.read_text()
    fields = statm.split()
    return int(fields[1]) * PAGESIZE


data = []
start_memory = get_resident_set_size()
for _ in range(10):
    data.append('X' * 100000)
    print(get_resident_set_size() - start_memory)

これにより、次のようなリストが生成されます。

0
0
368640
368640
368640
638976
638976
909312
909312
909312

100,000バイトを約3回割り当てると、約300,000バイトだけジャンプすることがわかります。


4

以下は、このプロセスが関数呼び出しの前に消費したメモリ量、関数呼び出し後に使用したメモリ量、および関数が実行された時間を追跡できる関数デコレータです。

import time
import os
import psutil


def elapsed_since(start):
    return time.strftime("%H:%M:%S", time.gmtime(time.time() - start))


def get_process_memory():
    process = psutil.Process(os.getpid())
    return process.memory_info().rss


def track(func):
    def wrapper(*args, **kwargs):
        mem_before = get_process_memory()
        start = time.time()
        result = func(*args, **kwargs)
        elapsed_time = elapsed_since(start)
        mem_after = get_process_memory()
        print("{}: memory before: {:,}, after: {:,}, consumed: {:,}; exec time: {}".format(
            func.__name__,
            mem_before, mem_after, mem_after - mem_before,
            elapsed_time))
        return result
    return wrapper

だから、あなたがそれで飾られたいくつかの機能を持っているとき

from utils import track

@track
def list_create(n):
    print("inside list create")
    return [1] * n

この出力を見ることができます:

inside list create
list_create: memory before: 45,928,448, after: 46,211,072, consumed: 282,624; exec time: 00:00:00

3
import os, win32api, win32con, win32process
han = win32api.OpenProcess(win32con.PROCESS_QUERY_INFORMATION|win32con.PROCESS_VM_READ, 0, os.getpid())
process_memory = int(win32process.GetProcessMemoryInfo(han)['WorkingSetSize'])

7
これは、それが何をするか、そしてそれがどのように機能するかについてのいくらかの説明で改善されるかもしれません。
ArtOfWarfare 2014年

2
返された大きな数値(8桁)と、私がほとんど何もしていないことに基づいて、これはバイトである必要があると思いますか?したがって、ややアイドル状態のインタラクティブインスタンスの場合は約28.5 MBです。(うわー...上記のコメントが4年前のものであることに気づきませんでした...それは奇妙です。)
ArtOfWarfare

3

Unixシステムの場合、コマンドtime(/ usr / bin / time)は、-vを渡した場合にその情報を提供します。Maximum resident set size以下を参照してください。これは、プログラムの実行中に使用され最大(ピーク)(仮想ではない)メモリです

$ /usr/bin/time -v ls /

    Command being timed: "ls /"
    User time (seconds): 0.00
    System time (seconds): 0.01
    Percent of CPU this job got: 250%
    Elapsed (wall clock) time (h:mm:ss or m:ss): 0:00.00
    Average shared text size (kbytes): 0
    Average unshared data size (kbytes): 0
    Average stack size (kbytes): 0
    Average total size (kbytes): 0
    Maximum resident set size (kbytes): 0
    Average resident set size (kbytes): 0
    Major (requiring I/O) page faults: 0
    Minor (reclaiming a frame) page faults: 315
    Voluntary context switches: 2
    Involuntary context switches: 0
    Swaps: 0
    File system inputs: 0
    File system outputs: 0
    Socket messages sent: 0
    Socket messages received: 0
    Signals delivered: 0
    Page size (bytes): 4096
    Exit status: 0

1
time代わりにを使用しようとすると、失敗する可能性があることに注意してください/usr/bin/time。参照:askubuntu.com/questions/434289/...
abought

1

shとosを使用してpython bayerの答えを調べます。

float(sh.awk(sh.ps('u','-p',os.getpid()),'{sum=sum+$6}; END {print sum/1024}'))

答えはメガバイトです。


4
`sh 'はstdlibモジュールではないことに注意してください。ただし、pipを使用してインストールできます。
ユルゲン・A.エアハルト
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.