次のような国のデータフレームがあるとします。
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
国を「ワンホットエンコーディング」に変換するpd.get_dummies関数があることを私は知っています。ただし、代わりに取得できるように、代わりにインデックスに変換したいと思いcc_index = [1,2,1,3]
ます。
以下に示すように、get_dummiesをnumpywhere句と一緒に使用するよりも高速な方法があると思います。
[np.where(x) for x in df.cc.get_dummies().values]
これは、Rで「factors」を使用して行う方がやや簡単なので、パンダにも同様の機能があることを期待しています。
cc_index = [0,1,0,2]
ですか?