回答:
どちらか:
df['index1'] = df.index
または、.reset_index
:
df.reset_index(level=0, inplace=True)
したがって、次のような3レベルのインデックスを持つマルチインデックスフレームがある場合:
>>> df
val
tick tag obs
2016-02-26 C 2 0.0139
2016-02-27 A 2 0.5577
2016-02-28 C 6 0.0303
インデックスの1番目(tick
)と3番目(obs
)のレベルを列に変換するには、次のようにします。
>>> df.reset_index(level=['tick', 'obs'])
tick obs val
tag
C 2016-02-26 2 0.0139
A 2016-02-27 2 0.5577
C 2016-02-28 6 0.0303
df.reset_index(level=df.index.names, inplace=True)
1が列に与えられた全体マルチインデックスを変換することができます
df.reset_index()
インデックス全体を変換する場合は、を使用します。これは、インデックス全体を列(レベルごとに1列)に移動し、0からlen(df)-1までのintインデックスを作成します
df['index1'] = df.index
、「DataFrameからのスライスのコピーに値を設定しようとしています」という警告を返します。以下に示すように、代わりにdf.assign()関数を使用してください。
もう少し明確にするために、インデックスに2つのレベルがあるマルチフレーム(MultiIndex)を見てみましょう。
index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'],
['North', 'South']],
names=['State', 'Direction'])
df = pd.DataFrame(index=index,
data=np.random.randint(0, 10, (6,4)),
columns=list('abcd'))
このreset_index
メソッドは、デフォルトのパラメーターで呼び出され、すべてのインデックスレベルを列に変換し、単純なRangeIndex
新しいインデックスを使用します。
df.reset_index()
level
パラメータを使用して、列に変換されるインデックスレベルを制御します。可能であれば、より明確なレベル名を使用してください。レベル名がない場合は、整数の位置で各レベルを参照できます。これは、外部から0から始まります。ここでスカラー値を使用するか、リセットするすべてのインデックスのリストを使用できます。
df.reset_index(level='State') # same as df.reset_index(level=0)
まれに、インデックスを保持してインデックスを列にしたい場合は、次の操作を実行できます。
# for a single level
df.assign(State=df.index.get_level_values('State'))
# for all levels
df.assign(**df.index.to_frame())
rename_axis
+ reset_index
あなたはまず、目的のラベルにあなたのインデックスの名前を変更することができ、その後シリーズに昇格します:
df = df.rename_axis('index1').reset_index()
print(df)
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
これはMultiIndex
データフレームでも機能します:
print(df)
# val
# tick tag obs
# 2016-02-26 C 2 0.0139
# 2016-02-27 A 2 0.5577
# 2016-02-28 C 6 0.0303
df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()
print(df)
index1 index2 index3 val
0 2016-02-26 C 2 0.0139
1 2016-02-27 A 2 0.5577
2 2016-02-28 C 6 0.0303
このreset_index
メソッドを使用し、既存のインデックスも保持したい場合は、以下を使用する必要があります。
df.reset_index().set_index('index', drop=False)
またはそれを適切に変更するには:
df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)
例えば:
print(df)
gi ptt_loc
0 384444683 593
4 384444684 594
9 384444686 596
print(df.reset_index())
index gi ptt_loc
0 0 384444683 593
1 4 384444684 594
2 9 384444686 596
print(df.reset_index().set_index('index', drop=False))
index gi ptt_loc
index
0 0 384444683 593
4 4 384444684 594
9 9 384444686 596
また、インデックスラベルを削除する場合は、次のようにします。
df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
index gi ptt_loc
0 0 384444683 593
4 4 384444684 594
9 9 384444686 596
df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1
new gi ptt
0 0 232 342
1 1 66 56
2 2 34 662
3 3 43 123