移動平均モデルの誤差項


17

これは、Box-Jenkins MAモデルに関する基本的な質問です。私が理解しているように、MAモデルは基本的に以前のエラー項に対する時系列値線形回帰です。つまり、観測値は最初に以前の値に対して回帰され、次に1つ以上の値がMAのエラー項として使用されますモデル。Yet,...,etnYYt1,...,YtnYY^

しかし、ARIMA(0、0、2)モデルで誤差項はどのように計算されますか?MAモデルが自己回帰部分なしで使用され、したがって推定値がない場合、どのようにしてエラー項を取得できますか?


1
いいえ、MA(n)モデルの定義を混同していると思います。回帰はの観点からのみであり、その推定ではがデータから推定されます。 e t ietieti
西安

1
質問の主な問題は、MAモデルは基本的に線形回帰であると言うことです。私たちはエラー用語を観察しないため、これは単に真実ではありません。
mpiktas

エラー用語実際には、ここではまたは単にとます。そのため、MAモデルパラメーターの推定値は、部分自己相関関数の繰り返しパターン、つまり残差の動作から導出されます。代わりに、ARパラメーターの推定は、acf(Y)の繰り返しパターンに基づいています。 Y E Y | YのトンT - NYのT - YのT - 1 YYtYt^Y^E(Y|Yt,...,tn)YtYt1Y
ロバートキューブリック

回答:


20

MAモデルの推定:

100個の時点を持つシリーズを想定し、これが切片のないMA(1)モデルによって特徴付けられるとしましょう。次に、モデルは

yt=εtθεt1,t=1,2,,100(1)

ここでのエラー用語は観察されません。だから、これを得るために、ボックス等。時系列分析:予測と制御(第3版)(228ページは、エラー項が再帰的に計算されることを示唆しています。

εt=yt+θεt1

したがって、のエラー項は、 です。 値がわからないと、これを計算できません。したがって、これを取得するには、モデルの初期推定値または予備推定値を計算する必要があります。同書のセクション6.3.2の202ページには、ε 1 = Y 1 + θ ε 0 θt=1

ε1=y1+θε0
θ

MA()プロセスの最初の自己相関は非ゼロであり、モデルのパラメーターに関して 発現のための上記 点で、用品に式未知数。 sの予備推定値は、上記の式の推定値をに代入することで取得できます。Q ρ K = - θ K + θ 1つのθ K + 1 + θ 2 θ K + 2 + + θ Q - K θ Qqq

ρk=θk+θ1θk+1+θ2θk+2++θqkθq1+θ12+θ22++θq2k=1,2,,q
ρ1,ρ2,ρqθ1,θ2,,θqqqθrkρk

は推定自己相関であることに注意してください。セクション6.3-パラメータの初期推定値に詳細な説明がありますので、それを読んでください。ここで、初期推定を取得すると仮定します。その後、 さて、もう一つの問題は、私たちが値を持っていないですので、 1から始まり、我々はできるようでないコンピュート。幸いなことに、これを取得する方法は2つあります。rkθ=0.5

ε1=y1+0.5ε0
ε0tε1
  1. 条件付き尤度
  2. 無条件の尤度

Boxらによると セクション7.1.3の227ページで、が中程度または大きい場合、の値を近似値としてゼロに置き換えることができます。この方法は条件付き尤度です。それ以外の場合、無条件尤度が使用されます。この場合、の値は、バック予測によって取得されます。この方法をお勧めします。バック予測の詳細については、セクション7.1.4の231ページをご覧くださいε0nε0

の初期推定値と値を取得した後、最終的にエラー項の再帰的計算に進むことができます。最後の段階は、モデルのパラメーターを推定することです。これはもう予備的な推定ではないことに注意してください。ε0(1)

パラメーター推定では、MAモデルはそのパラメーターに対して非線形であるため、非線形推定手順、特にLevenberg-Marquardtアルゴリズムを使用します。θ

全体として、Boxなどを読むことを強くお勧めします時系列分析:予測と制御(第3版)


とはですか?rk
Piyush Divyanakar

4

Gaussian MA(q)モデルは(BoxとJenkinsだけでなく!) ので、MA(q)モデルは「純粋な」エラーモデルであり、次数は相関関係がどこまで戻るかを定義します。

Yt=i=1qϑieti+σet,etiidN(0,1)
q

1
がどこから来たのかはまだわかりません。ある確率変数?私はそうは思わない、さもなければなぜ相関を探すのを悩ますのか etetq
ロバートキューブリック

1
数式にマイナスがあるのはなぜですか?通常、マイナスはARモデルの場合です。数学的には問題ではありません。MAモデルでマイナスを見たことがないので、興味があります。
mpiktas

3
@ RobertKubrick、Wold分解定理を知っていますか?各定常プロセスには、対応するイノベーションプロセスがあります。これは、用語由来です。et
mpiktas

1
存在する技術革新のための見通しどこか(があるように持って、誤差項にいくつかの背景を与えるが、私はまだ技術革新プロセスはどこから来るのは明らかではないよ@mpiktasのおかげで、en.wikipedia.org/wiki/Innovation_( signal_processing))。最適な予測は単に、つまりシリーズの平均ですか?E Y YE(Y)
ロバートキューブリック

1

「観測は最初にその以前の値に対して回帰され、次に1つ以上の値がエラー項として使用されますMAモデル。」私が言うことは、は2つの予測子系列およびに対して回帰され、すべてのi = 3,4 ,,,, tに対して相関のないエラープロセスを生成するということです。 2つの回帰係数:の影響示す及びの影響示す。したがって、YのT - 1Y T - N Y - Y Y E T - 1 E T - 2 E T θ 1 E T - 1 θ 2 E T - 2 E T θ 1 θ 2 θ 1 θ 2YYt1,...,YtnYY^Yet1et2etθ1et1θ2et2etn-2個の値を含むホワイトノイズランダムシリーズです。n-2個の推定可能な関係があるため、e1とe2が0.0に等しいという仮定から始めます。これで、と任意のペアについて、t-2残差値を推定できます。誤差の最小二乗和が得られる組み合わせは、および最適な推定値にます。θ1θ2θ1θ2


他の2つの予測子シリーズとは何ですか?私が持っている文献を見るとき、それが明確に特定されていないので、私は尋ねています。これら2 つのシリーズはとは無関係ですか?すべてのARIMAの定式化はシリーズに限定されているという印象を受けました。YYY
ロバートキューブリック

1
2つの予測子は、誤差項の遅れです。始める前に誤差項がわからないので、これらはアプリオリに知られていないため、これは非線形推定によって処理する必要がある理由です。あなたが抱えている混乱は、過去に有限なモデル(すなわち、AR MODEL)は、エラーが無限にある可能性があり、エラーが有限であるモデル(つまり、MA MODEL)は、Yの過去に潜在的に無限です。ARモデルとMAモデルを選択する理由は、節約のためです。Yの履歴とエラーの履歴の両方をブレンドするARMAモデルを作成する場合があります。
-IrishStat

1
他の答えでコメントしたように、まだ不足しているのは、イノベーション計算に使用されるの最適な予測です。e t nYetn
ロバートキューブリック

1

私のポストを参照してくださいここで MAシリーズの乱れの用語を理解する方法の説明のために。

それらを推定するには、さまざまな推定手法が必要です。これは、MAプロセスが現在の回帰の残差を使用するため、最初に線形回帰の残差を取得してから、説明変数として時間差残差値を含めることができないためです。この例では、2つの回帰式を作成し、一方から他方への残差を使用しています。これはMAプロセスとは異なります。OLSでは推定できません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.