複数のカテゴリー列を変換する
私のデータセットには、列挙したい2つのカテゴリー列があります。2つの列には両方の国が含まれており、一部が重複しています(両方の列に表示されます)。同じ国のcolumn1とcolumn2に同じ番号を付けたいのですが。 私のデータは次のように見えます: import pandas as pd d = {'col1': ['NL', 'BE', 'FR', 'BE'], 'col2': ['BE', 'NL', 'ES', 'ES']} df = pd.DataFrame(data=d) df 現在、私はデータを次のように変換しています: from sklearn.preprocessing import LabelEncoder df.apply(LabelEncoder().fit_transform) ただし、これはFRとESを区別しません。次の出力に到達する別の簡単な方法はありますか? o = {'col1': [2,0,1,0], 'col2': [0,2,4,4]} output = pd.DataFrame(data=o) output