5
欠落している日付をパンダデータフレームに追加する
私のデータには、特定の日付に複数のイベントがあるか、日付にイベントがありません。私はこれらのイベントを受け取り、日付ごとにカウントを取得してプロットします。しかし、それらをプロットすると、2つのシリーズが常に一致するとは限りません。 idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() 上記のコードでは、idxはたとえば30日付の範囲になります。2013 年9月1日から2013 年9月30日までただし、特定の日付にイベントが発生しなかったため、Sは25日または26日しかありません。次に、プロットしようとするとサイズが一致しないため、AssertionErrorが発生します。 fig, ax = plt.subplots() ax.bar(idx.to_pydatetime(), s, color='green') これに取り組む適切な方法は何ですか?IDXから値のない日付を削除しますか、それとも(そうしたいのですが)、0のカウントで欠落している日付をシリーズに追加しますか?値が0の30日間の完全なグラフが必要です。このアプローチが正しい場合、開始方法に関する提案はありますか?何らかの動的reindex機能が必要ですか? これがS(df.groupby(['simpleDate']).size() )のスニペットです。04と05のエントリがないことに注意してください。 09-02-2013 2 09-03-2013 10 09-06-2013 5 09-07-2013 1