pandasライブラリを使用してCSVデータを読み込んでいます。私のデータでは、特定の列に文字列が含まれています。"nan"
空の文字列と同様に、文字列は可能な値です。私はパンダに "nan"を文字列として読み取らせることができましたが、空の値をNaNとして読み取らないようにする方法を理解できません。ここにサンプルデータと出力があります
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
「nan」は文字列「nan」として正しく読み取られますが、空のセルはNaNとして読み取らstr
れconverters
ます。read_csv の引数に(converters={'One': str})
)を渡してみましたが、空のセルはNaNとして読み取られます。
fillnaを使用して、読み取り後に値を入力できることはわかっていますが、特定のCSV列の空のセルをNaNではなく空の文字列として読み取る必要があることをパンダに伝える方法はありませんか?
keep_default_na
以下のより最近のオプションを使用して、より簡単な答えに注意してください。