私の派手な配列はnp.nan
欠損値を指定するために使用します。データセットを反復処理するとき、そのような欠損値を検出して特別な方法で処理する必要があります。
単純に私はを使用しましたがnumpy.isnan(val)
、がval
サポートするタイプのサブセットに含まれない限り、うまく機能しnumpy.isnan()
ます。たとえば、不足しているデータが文字列フィールドで発生する可能性があります。その場合、次のようになります。
>>> np.isnan('some_string')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
例外をキャッチして返す高価なラッパーを作成する以外False
に、これをエレガントかつ効率的に処理する方法はありますか?
@Marius:
—
Dun Peal 2013
pandas.isnull()
完全に動作するようです。私が現在扱っている唯一のデータ型numpy.isnan()
は、文字列でありpandas.isnull()
、適切に処理されます。実際、私が投げた任意のオブジェクトはすべてうまく処理できるようです。懸念されていた特定の問題はありましたか?それ以外の場合は、少なくともパンダのユーザーにとっては標準的な回答のように思えるため、コメントを本格的な回答として送信することをお勧めします。
pandas
持っているpandas.isnull()
:それがあなたのニーズを満たしているかどうかわからないので、いくつかのサンプルデータが良いかもしれません。