前書き
私は、いくつかのマクロ経済指標( 1を示す)の年間成長率を予測することを目指しています。タスクの1つは、外生変数(、行列)がある場合とない場合のライバル時系列モデルの予測パフォーマンスをテストすることです。ライバルモデルのリストは次のとおりです。
- AR(I)MAモデル(年間成長率に「単位Roo」があるとは考えられませんが、後者は想定またはテストされています)
- ARMAエラーのある線形回帰モデル
- 従属変数モデル(外生変数を含む自己回帰モデル)
- 線形回帰モデル
ここで強い白色雑音であると仮定され、ゼロ平均定数の分散処理をIID。およびは、(バックシフト(ラグ)演算子を使用した自己回帰(次数)および移動平均(次数)の多項式です。
主で唯一の目標はパフォーマンスの予測であるため、パラメータ推定の「良い」プロパティは二次的な問題であることに注意してください。私が必要なのは、開始条件予測ツールに対して最も簡潔で堅牢なものをテストすることです。いずれかのaccuracy()
オプションで決定しますが、最初に比較用の資料を入手する必要があります。
モデル1.および2.はauto.arima()
、デフォルトの"CSS-ML"
推定方法で推定されます。モデル3.および4.は、通常の最小二乗(lm()
)によって推定されます。は約クォーターです。
これまでに試みたアプローチ
ジャックナイフ残差を作成するために、「ローリング」で示される最初のアプローチが実装されました。時系列データの実行可能な大きなサブサンプルから開始して、パラメーターが推定され、関数によって先の予測が行われます(編集:これは、前半のRobの2番目の質問に対する回答と同じ提案です)。その後、1つのポイントが追加され、推定/予測のステップが繰り返されます。predict()
このような実験の弱点は、パラメーターの推定に使用される時間ティック(サンプルサイズ)の数が異なることです。推定のサンプルサイズを固定したまま、開始条件に対する堅牢性をテストしたいと思います。
これを念頭において、私は、いくつかの後続の値に設定しようとした(編集:間隔の)におけるある欠損値(NA)。モデル2.-4の場合。これは、データ行列対応する後続の行を削除することも意味します。3.および4.の予測は簡単です(省略されたデータ行と同じです)。私のすべての懸念はモデル1と2に関するものです。predict()
AR()部分のみで、予測は順次実行されます。しかし、MA()が存在する場合、推定されたパラメーターを直接使用することはできません(?)。BrockwellとDavisの「時系列と予測の紹介」の第3.3章から、推定された自己回帰および移動平均パラメーターを含む特定の方程式系からを再帰的に推定するには、革新アルゴリズムが必要であることがます。編集:これらの
ご質問
auto.arima()
サンプル内に欠損値が存在しても正しく機能しますか?[すでにロブが答えました。]
編集:ARMAパーツのパラメーターが正しく推定されているので、最初のサブサンプルの推定パラメーターとデータのみを含めるようにarimaオブジェクトを合法的に再配置して、予測関数を使用できますか?
mod
predict.Arima
KalmanForecast()
。これは、状態空間表現がではなく同じ推定されたで提供されるため、予想されたものです。したがって、残っている唯一の問題は、ポイント予測に影響を与えるために重要なとの違いですか?私は答えが否定的であることを望みます。
itsmr
arima
Arima
Arima