時系列モデルのジャックナイフ


8

前書き

私は、いくつかのマクロ経済指標( 1を示すYt)の年間成長率を予測することを目指しています。タスクの1つは、外生変数(、行列)がある場合とない場合のライバル時系列モデルの予測パフォーマンスをテストすることです。ライバルモデルのリストは次のとおりです。XtT×k

  1. AR(I)MAモデル(年間成長率に「単位Roo」があるとは考えられませんが、後者は想定またはテストされています)
    A(L)Yt=μ+B(L)εt
  2. ARMAエラーのある線形回帰モデル
    Yt=Xtβ+ηt,  A(L)ηt=B(L)εt
  3. 従属変数モデル(外生変数を含む自己回帰モデル)
    A(L)Yt=Xtβ+εt
  4. 線形回帰モデル
    Yt=Xtβ+εt

ここで強い白色雑音であると仮定され、ゼロ平均定数の分散処理をIID。およびは、(バックシフト(ラグ)演算子を使用した自己回帰(次数)および移動平均(次数)の多項式です。εtA(L)B(L)pqL

主で唯一の目標はパフォーマンスの予測であるため、パラメータ推定の「良い」プロパティは二次的な問題であることに注意してください。私が必要なのは、開始条件予測ツールに対して最も簡潔で堅牢なものをテストすることです。いずれかのaccuracy()オプションで決定しますが、最初に比較用の資料を入手する必要があります。

モデル1.および2.はauto.arima()、デフォルトの"CSS-ML"推定方法で推定されます。モデル3.および4.は、通常の最小二乗(lm())によって推定されます。は約クォーターです。T40

これまでに試みたアプローチ

ジャックナイフ残差を作成するために、「ローリング」で示される最初のアプローチが実装されました。時系列データの実行可能な大きなサブサンプルから開始して、パラメーターが推定され、関数によって先の予測が行われます(編集:これは、前半のRobの2番目の質問に対する回答と同じ提案です)。その後、1つのポイントが追加され、推定/予測のステップが繰り返されます。hpredict()

このような実験の弱点は、パラメーターの推定に使用される時間ティック(サンプルサイズ)の数が異なることです。推定のサンプルサイズを固定したまま、開始条件に対する堅牢性をテストしたいと思います。

これを念頭において、私は、いくつかの後続の値に設定しようとした(編集:間隔の)におけるある欠損値(NA)。モデル2.-4の場合。これは、データ行列対応する後続の行を削除することも意味します。3.および4.の予測は簡単です(省略されたデータ行と同じです)。私のすべての懸念はモデル1と2に関するものです。k+p+q<t0<t1<Th+1YtXtpredict()Xt

AR()部分のみで、予測は順次実行されます。しかし、MA()が存在する場合、推定されたパラメーターを直接使用することはできません(?)。BrockwellとDavisの「時系列と予測の紹介」の第3.3章から、推定された自己回帰および移動平均パラメーターを含む特定の方程式系からを再帰的に推定するには、革新アルゴリズムが必要であることがます。編集:これらのpYt+1|t=A^(L)Ytqθn,jθn,jθjθn,jθj

q

ご質問

  1. auto.arima()サンプル内に欠損値が存在しても正しく機能しますか?[すでにロブが答えました。]
  2. p>0q>0

編集:ARMAパーツのパラメーターが正しく推定されているので、最初のサブサンプルの推定パラメーターとデータのみを含めるようにarimaオブジェクトを合法的に再配置して、予測関数を使用できますか?

modpredict.ArimaYt+1|tA^(L)(YtXtβ^)+Xtβ^+B^(L)ε^tKalmanForecast()。これは、状態空間表現がではなく同じ推定されたで提供されるため、予想されたものです。したがって、残っている唯一の問題は、ポイント予測に影響を与えるために重要なとの違いですか?私は答えが否定的であることを望みます。θjθn,jθjθn,j


itsmrηtεtarimaYtXtβ^ArimaArima

μ=0itsmrArima

回答:


4

q>0

特定の質問に答えるには:

  1. auto.arima()arima()尤度を計算するために状態空間表現を使用する呼び出し。欠損値は自然に状態空間形式で処理されます。だから、はい、正しく処理されます。

  2. 欠損値はによって推定されませんarima()。それらを予測する場合(つまり、過去のデータのみを使用する場合)、欠落しているシーケンスの開始点までモデルを近似し、そこから予測します。それらを推定する場合(前後のデータを使用して)、同等の状態空間モデルに基づくカルマンスムーザーを使用する必要があります。ほぼ同じ結果が得られる別のファッジは、最後の欠落していないデータまでのデータを使用した予測と、欠落したシーケンスの後の最初の欠落していないデータまでのデータを使用したバックキャストを平均化することです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.