ARIMA予測、季節性と傾向、奇妙な結果


9

ARIMAモデルを使用した予測に足を踏み入れているとき、季節性とドリフトに適合するARIMAに基づいて予測を改善する方法を理解しようとしています。

私のデータは次の時系列です(3年以上、明確な上昇傾向と目に見える季節性があり、ラグ12、24、36の自己相関ではサポートされていないようです)。

    > bal2sum3years.ts
             Jan     Feb     Mar     Apr     May     Jun     Jul     Aug          
    2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729 
    2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888 
    2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416 
             Sep     Oct     Nov     Dec
    2010 2232261 2394644 2468479 2816287
    2011 2480940 2699780 2760268 3206372
    2012 2951516 3119176 3032960 3738256

によって提案されたモデルauto.arima(bal2sum3years.ts)は私に次のモデルを与えました:

    Series: bal2sum3years.ts 
    ARIMA(0,0,0)(0,1,0)[12] with drift         

    Coefficients:
              drift
          31725.567
    s.e.   2651.693

    sigma^2 estimated as 2.43e+10:  log likelihood=-321.02
    AIC=646.04   AICc=646.61   BIC=648.39

ただし、acf(bal2sum3years.ts,max.lag=35)0.3を超えるacf係数は表示されません。ただし、データの季節性はかなり明白です。毎年の初めに急上昇します。これは、シリーズがグラフでどのように見えるかです。 元の時系列

fit=Arima(bal2sum3years.ts,seasonal=list(order=c(0,1,0),period=12),include.drift=TRUE)関数によって呼び出されるを使用した予測によりforecast(fit)、次の12か月の平均は、データの最後の12か月と定数に等しくなります。これはplot(forecast(fit))

実際のデータと予測されたデータ

また、自己相関ではありませんが、正の平均(非ゼロ)をもつ残差もチェックしました。

私の意見では、近似は元の時系列を正確にモデル化していません(青は元の時系列、赤はfitted(fit)

オリジナルvsフィット

ゲストは、モデルが間違っていますか?何か不足していますか?モデルを改善するにはどうすればよいですか?モデルは文字通り過去12か月かかり、次の12か月を達成するために定数を追加するようです。

私は時系列予測モデルと統計の比較的初心者です。


フィットは元の時系列を正確にモデル化していない、と私は思う」-なぜあなたはそれを期待しますか?
Glen_b-モニカを復活させる2013

@Glen_b、この意見は私がプロットを見るときに私が見る違いに基づいていました。たとえば、会計目的で毎月の売上を予測しようとすると、エラーが大きくなる可能性があります...
zima

プロットを見るとわかる違い」は時系列を正確にモデル化していない」という別の言い方です。これは論争中ではありません。より良い予測への欲求のあなたの表現は、すべての予測者が持っているのと同じ欲望です。多くの場合、それは非常に重要です。それにもかかわらず、この欲求はデータにより多くの情報を入れません。すべてのARIMAモデル(実際、このタスクに関連する時系列モデル)には、ゼロ以外のエラー項があります。データと適合の間には常に不一致があります。モデル化できるものを見逃していると思わせるものはありますか?
Glen_b-2013

私は何かについて考えました。たぶんARIMAモデルは、データの性質、つまりWebサイトでのユーザーのアクティビティを考慮に入れていないため、実際にはデータを反映できません。特別なイベントやプロモーションなど、季節性だけでなく、数値に影響を与える他のイベントもあると思います。多分、他の予測方法(ARIMAではない)ですが、機械学習技術を含むより複雑な方法では、値をより正確に予測できます。調べてみます。
zima 2013

かなりもっともらしい。もしそうなら、あなたは残差のそのような失敗を特定できるはずです。ARIMAモデルと構造時系列モデルの両方に、回帰条件を介した特別なイベントやプロモーションなどを組み込むことができることに注意してください。時系列回帰モデルはかなり一般的です。
Glen_b-2013

回答:


9

[12]

はい、確かに、推奨されるモデルは「この6月=昨年の6月+定数+エラー」であり、他の月についても同様です。

正確には何が問題なのですか?それはあなたのデータの優れた説明のようです。

時系列分解の方が直感的で説明しやすいかもしれません。おそらく、基本構造モデル(季節性のあるモデル)に基づいたものでさえありますが、それは必ずしも、使用しているモデルよりも機能が優れているモデルを意味するわけではありません。それでも、1つ以上の標準分解手法を試してみる価値があるかもしれません。よく理解しているモデルについては、多くのことを言う必要があります。


1

私たちの問題は、従来のモデルを試さずにARIMAモデルに直接ジャンプしていることだと思います。このため、モデルが必要な結果を与えていないことがわかります。あなたの場合、あなたのデータをテストしましたが、12か月ごとに明らかな季節性があることがわかりましたが、3項の単純な移動平均季節調整:乗法が最良のモデルであることがわかりました。私の意見では、高度な手法にジャンプする前に、従来の予測アルゴリズムを試す必要があります。 質問データの12か月予測


1
提案するモデルは、(3,0,0)(0,0,0)という形式のARIMAモデルで、3つの係数を.333、.333と.333に定数0.0にハードコーディングしています。したがって、有馬モデルの形式を想定しているだけでなく、係数の値を想定しており、系列に外れ値は存在していません。モデルの形式とパラメーターの最適値の観点から、データがそれ自体を説明できるようにします。失うものは何もなく、得るものはたくさんあります。確かにあなたのモデルが正しければ、それは見つかるでしょう。すべての有馬モデルは過去の加重関数です。
IrishStat

1
stats.stackexchange.com/questions/40905/…は、加重モデリングと有馬がどのように関連しているかを詳しく説明しています。このように、ARIMAモデルは、質問の答えとして、過去?正確にそれらの値は何ですか?
IrishStat
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.