nan値をゼロに変換する


95

2Dのnumpy配列があります。この配列の値の一部はNaNです。この配列を使用して特定の操作を実行したいと思います。たとえば、次の配列について考えてみます。

[[   0.   43.   67.    0.   38.]
 [ 100.   86.   96.  100.   94.]
 [  76.   79.   83.   89.   56.]
 [  88.   NaN   67.   89.   81.]
 [  94.   79.   67.   89.   69.]
 [  88.   79.   58.   72.   63.]
 [  76.   79.   71.   67.   56.]
 [  71.   71.   NaN   56.  100.]]

各行を一度に1つずつ取得し、逆の順序で並べ替えて、行から最大3つの値を取得し、それらの平均を取得しようとしています。私が試したコードは次のとおりです。

# nparr is a 2D numpy array
for entry in nparr:
    sortedentry = sorted(entry, reverse=True)
    highest_3_values = sortedentry[:3]
    avg_highest_3 = float(sum(highest_3_values)) / 3

これは、を含む行では機能しませんNaN。私の質問は、NaN2D numpy配列のすべての値をゼロに変換する簡単な方法があるので、並べ替えやその他のことで問題が発生しないかどうかです。


1
each: map: return isNaN(value) ? 0 : value
kirilloid 2011

@kirilloid:いいですね、使用例はどうですか?
serv-inc 2016

回答:


122

これは機能するはずです:

from numpy import *

a = array([[1, 2, 3], [0, 3, NaN]])
where_are_NaNs = isnan(a)
a[where_are_NaNs] = 0

上記の場合、where_are_NaNsは次のとおりです。

In [12]: where_are_NaNs
Out[12]: 
array([[False, False, False],
       [False, False,  True]], dtype=bool)

138

A2D配列はどこにありますか:

import numpy as np
A[np.isnan(A)] = 0

この関数isnanは、NaN値がどこにあるかを示すブール配列を生成します。ブール配列を使用して、同じ形状の配列にインデックスを付けることができます。マスクのように考えてください。


40

どの程度nan_to_num()


11
nan_to_num()も無限大を変更します-これは場合によっては望ましくないかもしれません。
アゴス

11
また、他の方法よりも10倍以上遅くなります。
user48956 2018年

7
tat "> 10x遅い"ステートメントについてはよくわからなかったので、確認しました。確かに、それははるかに遅いです。これを指摘してくれてありがとう。
ガブリエル

16

あなたがnp.where持っている場所を見つけるために使用することができますNaN

import numpy as np

a = np.array([[   0,   43,   67,    0,   38],
              [ 100,   86,   96,  100,   94],
              [  76,   79,   83,   89,   56],
              [  88,   np.nan,   67,   89,   81],
              [  94,   79,   67,   89,   69],
              [  88,   79,   58,   72,   63],
              [  76,   79,   71,   67,   56],
              [  71,   71,   np.nan,   56,  100]])

b = np.where(np.isnan(a), 0, a)

In [20]: b
Out[20]: 
array([[   0.,   43.,   67.,    0.,   38.],
       [ 100.,   86.,   96.,  100.,   94.],
       [  76.,   79.,   83.,   89.,   56.],
       [  88.,    0.,   67.,   89.,   81.],
       [  94.,   79.,   67.,   89.,   69.],
       [  88.,   79.,   58.,   72.,   63.],
       [  76.,   79.,   71.,   67.,   56.],
       [  71.,   71.,    0.,   56.,  100.]])

1
そのままでは動作しませんので、に変更np.where(np.isnan(a), a, 0)する必要がありますnp.where(~np.isnan(a), a, 0)。ただし、これは使用されるバージョンの違いである可能性があります。
TehTris 2018年

1
@TehTrisそうです、ありがとう。私はそれを私が思うb = np.where(np.isnan(a), 0, a)よりも簡単なものに変更しました~
アントンプロト


3

numpy.nan_to_numを使用できます :

numpy.nan_to_num(x):nanゼロに置き換え、inf有限数に置き換えます

例(ドキュメントを参照):

>>> np.set_printoptions(precision=8)
>>> x = np.array([np.inf, -np.inf, np.nan, -128, 128])
>>> np.nan_to_num(x)
array([  1.79769313e+308,  -1.79769313e+308,   0.00000000e+000,
        -1.28000000e+002,   1.28000000e+002])

1

nanがnanと等しくなることはありません

if z!=z:z=0

したがって、2Dアレイの場合

for entry in nparr:
    if entry!=entry:entry=0

これは機能しません:entryは1D配列であるため、テストでentry != entryは単純なブール値は得られませんが、が発生しValueErrorます。
Eric O Lebigot 2017

-1

1D配列の例であるラムダ関数を使用できます。

import numpy as np
a = [np.nan, 2, 3]
map(lambda v:0 if np.isnan(v) == True else v, a)

これにより、結果が得られます。

[0, 2, 3]

-7

目的のために、すべてのアイテムがとして保存されstr、使用しているとおりに並べ替えを使用する場合は、最初の要素を確認して「0」に置き換えます。

>>> l1 = ['88','NaN','67','89','81']
>>> n = sorted(l1,reverse=True)
['NaN', '89', '88', '81', '67']
>>> import math
>>> if math.isnan(float(n[0])):
...     n[0] = '0'
... 
>>> n
['0', '89', '88', '81', '67']

6
あなたのコメントは少し厳しいではありませんか?numpyが何であるかは知っていますが、配列が数値の文字列表現ではないことは知っていました。私は特にこれをnumpyの観点からではなく、Pythonの観点から取り上げました。
セントヒルクマラン2011

1
配列の並べ替えは、これを解決するための紛らわしい方法のように聞こえます。
holografix 2014年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.