毎週の季節性の基礎となる、季節ごとに調整された月ごとの成長


9

副趣味として、私は(特にRを使用して)予測時系列を調査してきました。

私のデータでは、1日あたりの訪問数があり、毎日約4年前に遡ります。このデータには、いくつかの明確なパターンがあります。

  1. 月曜日から金曜日は訪問数が多く(月曜日と火曜日が最高)、土日曜日は大幅に減ります。
  2. 1年のうち特定の時期に落ちる(例:米国の祝日の訪問数が大幅に減る、夏の成長が鈍くなる)
  3. 毎年大幅な成長

このデータで次の年を予測でき、季節ごとに調整された月ごとの成長に使用できると便利です。月次ビューで私を失望させる主なものは次のとおりです。

  • 特定の月は、他の月よりも月/火が多くなります(それは何年にもわたって一貫していません)。したがって、より多くの平日に発生する月は、それに応じて調整する必要があります。

週の番号付けシステムは年によって52〜53に変更されるため、週の調査も困難に思え、それをts処理できないようです。

私はその月の平日の平均を取ることを考えていますが、結果の単位は少し奇妙であり(平均平日の訪問数の増加)、それは有効なデータをドロップするでしょう。

この種類のデータは時系列で一般的であると思います(たとえば、オフィスビルでの電気使用量はこのようなものかもしれません)、特にRでそれをモデル化する方法について誰かがアドバイスを持っていますか?

私が使用しているデータは非常に簡単です、それは次のように始まります:

            [,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467

そして、現在に至るまでこのように続き、全体的な成長傾向、米国の休日の週あたりにいくらか落ち込み、夏の間は成長が全般的に鈍化しています。


データのもう1つの興味深い側面は、成長の全体的な傾向を2〜3か月間中断する突然のイベントがあることです。今は、季節性をきちんと設定しようとしている段階なので、その側面は無視しています。
カイル・ブラント

また、「季節性」を正しく使用していない場合は修正してください。私は現在、私が言う時間単位の範囲内でそれをパターンと考えています。つまり、「週ごとの季節性」とは、「毎週繰り返されるパターン」を意味します。
カイル・ブラント

うーん、おなじみのようです(-;

stats.stackexchange.com/questions/14742/…への回答をご覧ください。出発点かもしれません。
Peter Ellis

多分これの中心は週と年の組み合わせですか?1週間のサンプリング期間と1年間の「自然な」期間が合わないように見えますts(さらにmstsはカレンダーもそうではありません)。または、私はその方法を理解する方法を理解していません...
カイル・ブラント

回答:


5

このようなデータを常にモデル化しています。組み込む必要があります

  • 曜日
  • ホリデーエフェクト(リードエフェクト、同時エフェクト、ラグエフェクト)
  • 特別な日
  • おそらく、休暇前の金曜日または休暇後の月曜日
  • 毎週の効果
  • 毎月の効果
  • エラーホワイトノイズをレンダリングするためのARIMA構造。
  • et.al. 。

統計的アプローチは、介入検出を伴う伝達関数モデリングと呼ばれます。dave@autobox.comを介して、またはできればSEを介して非公開でデータを共有したい場合は、実際に最終モデルの詳細を示し、自分でまたは少なくともあなたを支援するあなたの能力を示していただければ幸いです。そして何がなされるべきか、何がなされ得るかを理解するための人々。どちらの場合も、コインや時間などの宝物を費やすことなく、より賢くなります。時系列の質問に対する私のその他の回答を読んで、詳細を学ぶこともできます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.