私のデータには、特定の日付に複数のイベントがあるか、日付にイベントがありません。私はこれらのイベントを受け取り、日付ごとにカウントを取得してプロットします。しかし、それらをプロットすると、2つのシリーズが常に一致するとは限りません。
idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max())
s = df.groupby(['simpleDate']).size()
上記のコードでは、idxはたとえば30日付の範囲になります。2013 年9月1日から2013 年9月30日までただし、特定の日付にイベントが発生しなかったため、Sは25日または26日しかありません。次に、プロットしようとするとサイズが一致しないため、AssertionErrorが発生します。
fig, ax = plt.subplots()
ax.bar(idx.to_pydatetime(), s, color='green')
これに取り組む適切な方法は何ですか?IDXから値のない日付を削除しますか、それとも(そうしたいのですが)、0のカウントで欠落している日付をシリーズに追加しますか?値が0の30日間の完全なグラフが必要です。このアプローチが正しい場合、開始方法に関する提案はありますか?何らかの動的reindex
機能が必要ですか?
これがS(df.groupby(['simpleDate']).size()
)のスニペットです。04と05のエントリがないことに注意してください。
09-02-2013 2
09-03-2013 10
09-06-2013 5
09-07-2013 1
reindex
素晴らしい機能です。(1)ラベルの新しいセットに一致するように既存のデータを並べ替え、(2)以前にラベルが存在しなかった場所に新しい行を挿入する、(3)欠落しているラベルのデータを埋める(順方向/逆方向の埋め込みを含む)(4)行を選択するラベルで!