私はこのようなデータフレームを持っています:
A B C
0 1 0.749065 This
1 2 0.301084 is
2 3 0.463468 a
3 4 0.643961 random
4 1 0.866521 string
5 2 0.120737 !
呼び出す
In [10]: print df.groupby("A")["B"].sum()
戻ります
A
1 1.615586
2 0.421821
3 0.463468
4 0.643961
ここで、「C」列についても「同じ」を行います。その列には文字列が含まれているため、sum()は機能しません(文字列を連結すると思われるかもしれませんが)。私が本当に見たいのは、各グループの文字列のリストまたはセットです。
A
1 {This, string}
2 {is, !}
3 {a}
4 {random}
私はこれを行う方法を模索しています。
Series.unique()(http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html)は機能しませんが、
df.groupby("A")["B"]
です
pandas.core.groupby.SeriesGroupBy object
だから私はどんなSeriesメソッドもうまくいくことを望んでいました。何か案は?
apply、とlambdasの必要性がなくなったようです。なぜpandas実際に連結し、文字列の合計時にエラーを返さないのかと思ってここに来ました。