副趣味として、私は(特にRを使用して)予測時系列を調査してきました。
私のデータでは、1日あたりの訪問数があり、毎日約4年前に遡ります。このデータには、いくつかの明確なパターンがあります。
- 月曜日から金曜日は訪問数が多く(月曜日と火曜日が最高)、土日曜日は大幅に減ります。
- 1年のうち特定の時期に落ちる(例:米国の祝日の訪問数が大幅に減る、夏の成長が鈍くなる)
- 毎年大幅な成長
このデータで次の年を予測でき、季節ごとに調整された月ごとの成長に使用できると便利です。月次ビューで私を失望させる主なものは次のとおりです。
- 特定の月は、他の月よりも月/火が多くなります(それは何年にもわたって一貫していません)。したがって、より多くの平日に発生する月は、それに応じて調整する必要があります。
週の番号付けシステムは年によって52〜53に変更されるため、週の調査も困難に思え、それをts
処理できないようです。
私はその月の平日の平均を取ることを考えていますが、結果の単位は少し奇妙であり(平均平日の訪問数の増加)、それは有効なデータをドロップするでしょう。
この種類のデータは時系列で一般的であると思います(たとえば、オフィスビルでの電気使用量はこのようなものかもしれません)、特にRでそれをモデル化する方法について誰かがアドバイスを持っていますか?
私が使用しているデータは非常に簡単です、それは次のように始まります:
[,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467
そして、現在に至るまでこのように続き、全体的な成長傾向、米国の休日の週あたりにいくらか落ち込み、夏の間は成長が全般的に鈍化しています。
ts
(さらにmsts
はカレンダーもそうではありません)。または、私はその方法を理解する方法を理解していません...