次の列のデータフレームdfがあります。
df['ArrivalDate'] =
...
936 2012-12-31
938 2012-12-29
965 2012-12-31
966 2012-12-31
967 2012-12-31
968 2012-12-31
969 2012-12-31
970 2012-12-29
971 2012-12-31
972 2012-12-29
973 2012-12-29
...
列の要素はpandas.tslib.Timestampです。
年と月だけを含めたい。簡単な方法があると思いましたが、わかりません。
これが私が試したものです:
df['ArrivalDate'].resample('M', how = 'mean')
次のエラーが発生しました:
Only valid with DatetimeIndex or PeriodIndex
それから私は試しました:
df['ArrivalDate'].apply(lambda(x):x[:-2])
次のエラーが発生しました:
'Timestamp' object has no attribute '__getitem__'
助言がありますか?
編集:私はそれをちょっと考え出した。
df.index = df['ArrivalDate']
次に、インデックスを使用して別の列をリサンプリングできます。
しかし、私はまだ列全体を再構成する方法が欲しいです。何か案は?
to_period
:(df.date_column.dt.month
または.year
、または.day
)動作