私からの時系列に関する別の質問。
私は、精神科病院での3年間にわたる暴力事件の毎日の記録を提供するデータセットを持っています。私の前の質問の助けを借りて、私はそれをいじっていて、今それについて少し幸せです。
私が今持っているのは、毎日のシリーズは非常にうるさいということです。それは、時々0から最大20まで、上下に大きく変動します。レスプロットと予測パッケージ(私のような初心者には強くお勧めします)を使用すると、予測から大規模な信頼区間を持つ、完全にフラットなラインが得られます。
ただし、毎週または毎月のデータを集計する方がはるかに理にかなっています。それらはシリーズの最初から下にスイープし、その後真ん中で再び増加します。レスプロットと予測パッケージはどちらも、より有意義に見えるものを生成します。
浮気みたいな感じがします。見栄えがよく、実際の妥当性がないため、集約されたバージョンを好むだけですか?
または、移動平均を計算してそれを基礎として使用する方が良いでしょうか?何が受け入れられるかについて自信を持てるほど、この背後にある理論を十分に理解していないと思います