時系列の予測モデルがあり、そのサンプル外の予測エラーを計算したい。現時点で私がフォローしている戦略は、Rob Hyndmanのブログ(ページの下部近く)で次のように提案されています(時系列およびサイズトレーニングセットを想定)
- モデルをデータに合わせ、次の観測の予測とします。、Y T + K
- として予測誤差を計算します。
- t = 1、\ dots、nkについて繰り返します
- 平均平方誤差を
私の質問は、トレーニングセットが重複しているため、相関についてどれだけ心配する必要があるかです。特に、次の値だけでなく、次の値も予測したいので、予測およびエラー、および予測エラーの用語構造を構築したい。
トレーニングセットのウィンドウを毎回1ずつ進めることができますか、それともmずつ進めますか?私が予測しているシリーズに有意な自己相関がある場合、これらの質問に対する答えはどのように変化しますか(おそらく記憶の長いプロセスです。つまり、自己相関関数は指数関数ではなくべき法則として減衰します)。
ここでの説明、またはMSE(またはその他のエラー測定値)の信頼区間に関する理論的な結果を見つけることができる場所へのリンクをいただければ幸いです。