パンダのデータフレームのインデックスを列に変換する方法は?


455

これはかなり明白に思えますが、データフレームのインデックスを列に変換する方法を理解できないようです。

例えば:

df=
        gi       ptt_loc
 0  384444683      593  
 1  384444684      594 
 2  384444686      596  

に、

df=
    index1    gi       ptt_loc
 0  0     384444683      593  
 1  1     384444684      594 
 2  2     384444686      596  

回答:


762

どちらか:

df['index1'] = df.index

または、.reset_index

df.reset_index(level=0, inplace=True)

したがって、次のような3レベルのインデックスを持つマルチインデックスフレームがある場合:

>>> df
                       val
tick       tag obs        
2016-02-26 C   2    0.0139
2016-02-27 A   2    0.5577
2016-02-28 C   6    0.0303

インデックスの1番目(tick)と3番目(obs)のレベルを列に変換するには、次のようにします。

>>> df.reset_index(level=['tick', 'obs'])
          tick  obs     val
tag                        
C   2016-02-26    2  0.0139
A   2016-02-27    2  0.5577
C   2016-02-28    6  0.0303

4
持っているすべてのインデックスに対してこれをn回実行する必要があることに注意してください(たとえば、2つのインデックスがある場合、2回実行する必要があります)
dval

34
df.reset_index(level=df.index.names, inplace=True)1が列に与えられた全体マルチインデックスを変換することができます
ヴェンティ

2
データフレームに追加したばかりの列にインデックスを設定して、真の列とインデックスを作成できますか?
bretcj7

2
マルチdf.reset_index()インデックス全体を変換する場合は、を使用します。これは、インデックス全体を列(レベルごとに1列)に移動し、0からlen(df)-1までのintインデックスを作成します
BallpointBen

2
列への割り当ては、たとえばdf['index1'] = df.index、「DataFrameからのスライスのコピーに値を設定しようとしています」という警告を返します。以下に示すように、代わりにdf.assign()関数を使用してください。
ジョンマーク

36

MultiIndexの場合、次のコマンドを使用してサブインデックスを抽出できます

df['si_name'] = R.index.get_level_values('si_name') 

どこsi_nameサブインデックスの名前です。


26

もう少し明確にするために、インデックスに2つのレベルがあるマルチフレーム(MultiIndex)を見てみましょう。

index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'], 
                                    ['North', 'South']], 
                                   names=['State', 'Direction'])

df = pd.DataFrame(index=index, 
                  data=np.random.randint(0, 10, (6,4)), 
                  columns=list('abcd'))

ここに画像の説明を入力してください

このreset_indexメソッドは、デフォルトのパラメーターで呼び出され、すべてのインデックスレベルを列に変換し、単純なRangeIndex新しいインデックスを使用します。

df.reset_index()

ここに画像の説明を入力してください

levelパラメータを使用して、列に変換されるインデックスレベルを制御します。可能であれば、より明確なレベル名を使用してください。レベル名がない場合は、整数の位置で各レベルを参照できます。これは、外部から0から始まります。ここでスカラー値を使用するか、リセットするすべてのインデックスのリストを使用できます。

df.reset_index(level='State') # same as df.reset_index(level=0)

ここに画像の説明を入力してください

まれに、インデックスを保持してインデックスを列にしたい場合は、次の操作を実行できます。

# for a single level
df.assign(State=df.index.get_level_values('State'))

# for all levels
df.assign(**df.index.to_frame())

15

rename_axis + reset_index

あなたはまず、目的のラベルにあなたのインデックスの名前を変更することができ、その後シリーズに昇格します:

df = df.rename_axis('index1').reset_index()

print(df)

   index1         gi  ptt_loc
0       0  384444683      593
1       1  384444684      594
2       2  384444686      596

これはMultiIndexデータフレームでも機能します:

print(df)
#                        val
# tick       tag obs        
# 2016-02-26 C   2    0.0139
# 2016-02-27 A   2    0.5577
# 2016-02-28 C   6    0.0303

df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()

print(df)

       index1 index2  index3     val
0  2016-02-26      C       2  0.0139
1  2016-02-27      A       2  0.5577
2  2016-02-28      C       6  0.0303

4

このreset_indexメソッドを使用し、既存のインデックスも保持したい場合は、以下を使用する必要があります。

df.reset_index().set_index('index', drop=False)

またはそれを適切に変更するには:

df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)

例えば:

print(df)
          gi  ptt_loc
0  384444683      593
4  384444684      594
9  384444686      596

print(df.reset_index())
   index         gi  ptt_loc
0      0  384444683      593
1      4  384444684      594
2      9  384444686      596

print(df.reset_index().set_index('index', drop=False))
       index         gi  ptt_loc
index
0          0  384444683      593
4          4  384444684      594
9          9  384444686      596

また、インデックスラベルを削除する場合は、次のようにします。

df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
   index         gi  ptt_loc
0      0  384444683      593
4      4  384444684      594
9      9  384444686      596

2
df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1

    new     gi     ptt
0    0      232    342
1    1      66     56 
2    2      34     662
3    3      43     123

5
この回答が既存の回答よりも優れていると思う理由についての議論を追加することをお勧めします...
dmcgrandle

0

これを行う非常に簡単な方法は、reset_index()メソッドを使用することです。データフレームdfの場合、以下のコードを使用します。

df.reset_index(inplace=True)

このようにして、インデックスは列になり、inplaceをTrueとして使用することにより、これは永続的な変更になります。


1
この回答は、すでに受け入れられている回答とどのように異なりますか?
Annosz
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.