キーでgroupbyオブジェクトの対応するgroupbyデータフレームにアクセスするにはどうすればよいですか?
次のgroupbyを使用します。
rand = np.random.RandomState(1)
df = pd.DataFrame({'A': ['foo', 'bar'] * 3,
'B': rand.randn(6),
'C': rand.randint(0, 20, 6)})
gb = df.groupby(['A'])
反復してキーとグループを取得できます。
In [11]: for k, gp in gb:
print 'key=' + str(k)
print gp
key=bar
A B C
1 bar -0.611756 18
3 bar -1.072969 10
5 bar -2.301539 18
key=foo
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
キーでグループにアクセスできるようにしたい:
In [12]: gb['foo']
Out[12]:
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
しかし、私がそれをやってみると、gb[('foo',)]
私がpandas.core.groupby.DataFrameGroupBy
望むDataFrameに対応するメソッドがないように見える、この奇妙なオブジェクトが表示されます。
私が考えることができる最高のものは:
In [13]: def gb_df_key(gb, key, orig_df):
ix = gb.indices[key]
return orig_df.ix[ix]
gb_df_key(gb, 'foo', df)
Out[13]:
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
しかし、パンダが通常これらのことにどれほど素晴らしいかを考えると、これはちょっと厄介です。
これを行う組み込みの方法は何ですか?
groups = dict(list(gb))
ストア列のみにすることができ ますC
か?他の列には関心がないため、それらを保存したくないとします。