非常に興味深い質問です。他の人の意見も知りたいです。私は統計学者ではなく訓練を受けたエンジニアなので、誰かが私のロジックをチェックできます。エンジニアとして、シミュレーションと実験を行いたいので、私はあなたの質問をシミュレートしてテストしたいと思っていました。
以下に経験的に示すように、ARIMAXでトレンド変数を使用すると、差分の必要がなくなり、シリーズトレンドが定常になります。これが、検証に使用したロジックです。
- ARプロセスのシミュレーション
- 確定的な傾向を追加しました
- 差異のない上記のシリーズを外生変数としてトレンドでモデル化されたARIMAXを使用します。
- ホワイトノイズの残差をチェックし、純粋にランダムです
以下はRコードとプロットです。
set.seed(3215)
##Simulate an AR process
x <- arima.sim(n = 63,list(ar = c(0.7)));
plot(x)
## Add Deterministic Trend to AR
t <- seq(1, 63)
beta <- 0.8
t_beta <- ts(t*beta,frequency=1)
ar_det <- x+t_beta
plot(ar_det)
## Check with arima
ar_model <- arima(ar_det,order=c(1,0,0),xreg=t,include.mean=FALSE)
## Check whether residuals of fitted model is random
pacf(ar_model$residuals)
AR(1)シミュレーションプロット
決定的傾向を伴うAR(1)
外因性の傾向があるARIMAX残留PACF。残さはランダムで、パターンは残っていません
上記からわかるように、決定論的傾向をARIMAXモデルの外生変数としてモデリングすると、差分の必要がなくなります。少なくとも決定論的なケースではうまくいきました。予測やモデル化が非常に難しい確率的傾向で、これがどのように動作するのだろうかと思います。
2番目の質問に答えるには、はい、ARIMAXを含むすべてのARIMAを静止させる必要があります。少なくともそれは教科書が言うことです。
さらに、コメントされているように、この記事を参照してください。確定的傾向と確率的傾向の非常に明確な説明と、それらを削除してトレンドを固定する方法と、このトピックに関する非常に素晴らしい文献調査。ニューラルネットワークのコンテキストで使用しますが、一般的な時系列問題に役立ちます。最終的な推奨事項は、確定的な傾向として明確に識別される場合、線形トレンド除去を行う場合、または時系列を固定するために差分を適用する場合です。審査員はまだそこにいますが、この記事で引用されているほとんどの研究者は、線形トレンド除去ではなく差分を推奨しています。
編集:
以下は、外生変数と差分アリマを使用したドリフト確率過程を伴うランダムウォークです。どちらも同じ答えを与えるように見え、本質的には同じです。
library(Hmisc)
set.seed(3215)
## ADD Stochastic Trend to simulated Arima this is AR(1) with unit root with non zero mean
y = rep(NA,63)
y[[1]] <- 2
for (i in 2:63) {
y[i] <-3+1*y[i-1]+ rnorm(1, mean = 0, sd = 1)
}
plot(y,type="l")
y_ts <- ts(y,frequency=1)
## Lag to create Xreg
y_1 <- Lag(y,shift=1)
## Start from 2 value to avoid NA and make it equal length with xreg
y <- window(y_ts,start =2,end=63)
xreg1 <- y_1[-1]
## Check the values with ARIMA and xreg
g <- arima(y,order=c(0,0,0),xreg=xreg1)
pacf(g$residuals)
## Check the values with ARIM
g1 <- arima(y,order=c(0,1,0))
pacf(g1$residuals)
##
ARIMA(0,0,0) with non-zero mean
Coefficients:
intercept xreg1
3.1304 0.9976
s.e. 0.2664 0.0025
お役に立てれば!