私は次の列を持つパンダのデータフレームを持っています:
n_0
n_1
p_0
p_1
e_0
e_1
列とサブ列を持つように変換したい:
0
n
p
e
1
n
p
e
私はドキュメントを検索しましたが、これを実装する方法が完全にわかりません。誰か提案はありますか?
私は次の列を持つパンダのデータフレームを持っています:
n_0
n_1
p_0
p_1
e_0
e_1
列とサブ列を持つように変換したい:
0
n
p
e
1
n
p
e
私はドキュメントを検索しましたが、これを実装する方法が完全にわかりません。誰か提案はありますか?
回答:
最後に、私は解決策を見つけました。
以下のスクリプト例を見つけることができます。
#!/usr/bin/env python3
import pickle
import pandas as pd
import itertools
import numpy as np
data = pd.DataFrame(np.random.randn(10, 5), columns=('0_n', '1_n', '0_p', '1_p', 'x'))
indices = set()
groups = set()
others = set()
for c in data.columns:
if '_' in c:
(i, g) = c.split('_')
c2 = pd.MultiIndex.from_tuples((i, g),)
indices.add(int(i))
groups.add(g)
else:
others.add(c)
columns = list(itertools.product(groups, indices))
columns = pd.MultiIndex.from_tuples(columns)
ret = pd.DataFrame(columns=columns)
for c in columns:
ret[c] = data['%d_%s' % (int(c[1]), c[0])]
for c in others:
ret[c] = data['%s' % c]
ret.rename(columns={'total': 'total_indices'}, inplace=True)
print("Before:")
print(data)
print("")
print("After:")
print(ret)
申し訳ありません...
columns=[('0', 'n'), ('0', 'p'), ('0', 'e'), ('1', 'n'), ('1', 'p'), ('1', 'e')]
df.columns = pd.MultiIndex.from_tuples(columns)