時系列予測を行う際の推奨事項


10

私は何カ月も短期的な負荷予測と精度を向上させるための気候/気象データの使用に取り組んできました。私はコンピューターサイエンスのバックグラウンドを持っているので、ARIMAモデルなどの統計ツールを使用して、大きな間違いや不当な比較を行わないようにしています。私はいくつかのことについてあなたの意見を知りたいです:

  1. (S)ARIMAモデルと(S)ARIMAXモデルの両方を使用して、気象データが予測に与える影響を調査していますが、指数平滑法も使用する必要があると思いますか?

  2. 最初の2週間から始めて、300サンプルの時系列の時系列があり、auto.arima R関数(予測パッケージ)で構築されたモデルを使用して5日間先の予測を実行します。次に、データセットに別のサンプルを追加し、モデルを再度キャリブレーションし、さらに5日間の予測を実行して、使用可能なデータが終わるまで続けます。この操作方法は正しいと思いますか?

エンジニアリングジャーナルの記事をターゲットにしていますが、統計的な観点からできる限り厳密な作業を行いたいと思います。


1
この質問は密接に関連していると表示されます。stats.stackexchange.com/questions/16915/...
whuber

1
ここでは、古い回答だ stats.stackexchange.com/questions/6513/...は
bill_080

回答:


9
  1. 指数平滑法モデルも検討する価値があると思います。指数平滑法モデルは、ARIMAモデルとは根本的に異なるモデルのクラスであり、データに異なる結果をもたらす可能性があります。

  2. これは有効なアプローチのように聞こえ、Rob Hyndmanによって提案された時系列相互検証法に非常に似ています。

各予測(指数平滑法、ARIMA、ARMAX)から相互検証エラーを集計し、全体的なエラーを使用して3つの方法を比較します。

auto.arimaを使用するのではなく、ARIMAパラメータの「グリッド検索」を検討することもできます。グリッド検索では、有馬モデルの可能な各パラメーターを探索し、予測精度を使用して「最良の」パラメーターを選択します。


返信ありがとうございます。STEPWISE検索を無効にしてauto.arimaを使用しています。このようにして、min-max範囲のすべてのパラメーターを調べます(Hyndman&Kandahar 2008の論文はまだ読んでいません)。
Matteo De Felice

@Matteo De Felice:AICに基づいてこれらのパラメーターを最適化しています。私は、クロスバリデーションで評価できるサンプル外のパフォーマンスによってこれらのパラメーターを最適化する価値があるかもしれないことを示唆していました。さらに、他のモデル(ETSなど)を比較する場合は、異なるタイプのモデル(auto.arimaやetsなど)間のAICを比較できないため、サンプル外のパフォーマンスメトリックが必要になります。
ザック

この時点でグリッド検索を実行し(stepwise = FALSEでauto.arimaを使用)、次にパフォーマンスを評価するために最も頻度の高いモデルを試しました。
Matteo De Felice

@Matteo De Felice:時系列相互検証の実装に問題がある場合は、次のブログ投稿が役立ちます:robjhyndman.com/researchtips/tscvexample
Zach

ARIMAモデルとETSモデルは基本的に異なっていないことに注意してください。実際、線形指数平滑化モデルはARIMAモデルの特殊なケースです。ここを参照してください:otexts.org/fpp/8/10
Wart
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.