オンラインゲームでのユーザーのスコアを表すタプル を含むストリームについて考え(user, new_score)
ます。ストリームは、毎秒100〜1,000の新しい要素を持つことができます。ゲームには20万人から30万人のユニークプレイヤーがいます。
次のような永続的なクエリが欲しいのですが。
- 1時間のスライディングウィンドウでxを超えるスコアを投稿したプレーヤー
- 1時間のスライディングウィンドウでx%のスコアを獲得したプレーヤー
私の質問は、このプロジェクトを迅速に開始するために使用できるオープンソースツールは何ですか?現在、エスパーを検討しています。
注:「マイニングデータストリーム」(大規模データセットのマイニングの第4章)を読み終えたばかりで、データストリームのマイニングはまったく初めてです。