辞書のリストへのPandas DataFrame

165

次のDataFrameがあります。

顧客item1 item2 item3
アップルミルクトマト1個
ウォーターオレンジポテト2個
3ジュースマンゴーチップ

行ごとの辞書のリストに変換したい

rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
    {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
    {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

— モハマドイブラヒム
ソース

2

Stack Overflowへようこそ！正しくレンダリングされるように、コードサンプルを4つのスペースでインデントしました。フォーマットの詳細については、編集ヘルプを参照してください。

— ByteHamster 2015

189

編集する

John Galtが彼の回答で述べているように、おそらく代わりに使用する必要がありますdf.to_dict('records')。手動でトランスポーズするよりも高速です。

In [20]: timeit df.T.to_dict().values()
1000 loops, best of 3: 395 µs per loop

In [21]: timeit df.to_dict('records')
10000 loops, best of 3: 53 µs per loop

元の答え

df.T.to_dict().values()以下のようにを使用します。

In [1]: df
Out[1]:
   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

In [2]: df.T.to_dict().values()
Out[2]:
[{'customer': 1.0, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2.0, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3.0, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

— ComputerFellow
ソース

2

各顧客に多数の行を含むデータフレームの場合の解決策は何ですか？

— アジズ

2

を使用するdf.T.to_dict().values()と、並べ替え順も緩くなります

— フセイン

unicodecsv.DictReader

— 辞書の

219

使用df.to_dict('records')-外部で転置する必要なく出力を提供します。

In [2]: df.to_dict('records')
Out[2]:
[{'customer': 1L, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2L, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3L, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

— ゼロ
ソース

2

結果のリストの各エントリにインデックス値を含めるにはどうすればよいですか？

— ガブリエルL.オリベイラ

5

@ GabrielL.Oliveiraあなたはdf.reset_index（）。to_dict（ 'records'）を実行できます

— Wei Ma

各ケースで予約されている列の順序、つまり結果のリストのn番目のエントリは常にn番目の列でもありますか？

— クレブ2018年

@Clebはi.e. is the nth entry in the resulting list always also the nth column?n番目の列またはn番目の行ですか？

— Nauman Naeem

14

John Galtの回答の拡張として-

次のDataFrameの場合、

   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

インデックス値を含む辞書のリストを取得したい場合は、次のようなことができます：

df.to_dict('index')

これは、親ディクショナリのキーがインデックス値であるディクショナリのディクショナリを出力します。この特定のケースでは、

{0: {'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 1: {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 2: {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}}

— ホセイン・ムクタディール
ソース

1

列を1つだけ選択したい場合は、これでうまくいきます。

df[["item1"]].to_dict("records")

下記のだろう、NOT仕事とTypeError例外を生成します。サポートされていないタイプを：。これは、シリーズを辞書に変換しようとしているのであって、データフレームを辞書に変換しようとしているのではないかと思います。

df["item1"].to_dict("records")

列を1つだけ選択し、それを列名をキーとしてディクショナリのリストに変換する必要があり、これを少しの間固執していたので、共有します。

— ジョーリベラ
ソース