Rのauto.arimaは、考えられる他のモデルよりもAIC、AICC、BICが高いモデルを報告する必要がありますか?


8

auto.arimaを使用して時系列モデル(Rob Hyndmanのサイトで説明さているよう、ARIMAエラーのある線形回帰)を近似しました情報基準の値を次のように報告します

AIC:2989.2 AICC:2989.3 BIC:3261.2

Arimaを使用して、ドリフト構造を持つ(1,1,1)のモデルを近似すると、出力は著しく低いICの

AIC:2510.3 AICC:2510.4 BIC:2759

auto.arimaに、ドリフトモデル(start.pおよびstart.qパラメーターを使用)で(1,1,1)を考慮するように強制できます。その際、 "trace = TRUE"を設定します。 (1,1,1)ドリフトモデルは考慮されますが、auto.arimaによって拒否されます。それでも(5,1,0)ドリフトモデルが最良の結果として報告されます。

auto.arimaが他の基準を使用してモデルを選択する状況はありますか?

追加するために編集(リクエストに応じて)

この例のデータは、このGoogleスプレッドシートで見つけることができます

例を再現するRコードは

repro = read.csv("mindata.csv")
reprots = ts(repro, start=1, frequency=24)
fitauto = auto.arima(reprots[,"lnwocone"],
xreg=cbind(fourier(reprots[,"lnwocone"], K=11),
reprots[,c("temp","sqt","humidity","windspeed","mist","rain")]),
start.p=1, start.q=1, trace=TRUE, seasonal=FALSE)
fitdirect <- Arima(reprots[,"lnwocone"], order=c(1,1,1), seasonal=c(0,0,0),
xreg=cbind(fourier(reprots[,"lnwocone"], K=11),
reprots[,c("temp","sqt","humidity","windspeed","mist","rain")]), include.drift=TRUE)
summary(fitauto)
summary(fitdirect)

Googleドキュメントデータ-インラインコードはサンプルを提供する最良の方法ではありません。私は過去のガイドラインでこれを行うための最良の方法を見てきましたが、今朝の検索でそれらのガイドラインを見つけることができませんでした。


1
再現可能な例を提供してください。
Rob Hyndman 2014年

回答:


9

auto.arima処理を高速化するために、いくつかの近似を使用します。最終的なモデルは完全なMLEを使用して適合されますが、引数を使用しない限り、モデルはCSSを使用して推定されますapproximation=FALSE。これはヘルプファイルで説明されています:

近似の 場合TRUE、推定は条件付き二乗和によって行われ、モデル選択に使用される情報基準が近似されます。最終モデルは依然として最尤推定を使用して計算されます。過度の計算時間を避けるために、近似は長い時系列または季節性の高い期間に使用する必要があります。

デフォルト設定はapproximation=(length(x)>100 | frequency(x)>12)です。これもヘルプファイルで指定されています。17544の観測値があるため、デフォルト設定ではが与えられapproximation=TRUEます。

近似を使用した場合、見つかった最良のモデルは、AICcが2989.33のARIMA(5,1,0)エラーのある回帰です。近似をオフにすると、最良のモデルにはARIMA(2,1,1)エラーがあり、AICcは2361.40になります。

> fitauto = auto.arima(reprots[,"lnwocone"], approximation=FALSE,
                xreg=cbind(fourier(reprots[,"lnwocone"], K=11),
                reprots[,c("temp","sqt","humidity","windspeed","mist","rain")]),
                start.p=1, start.q=1, trace=TRUE, seasonal=FALSE)
> fitauto
Series: reprots[, "lnwocone"] 
ARIMA(2,1,1) with drift         
...
sigma^2 estimated as 0.08012:  log likelihood=-1147.63
AIC=2361.27   AICc=2361.4   BIC=2617.76

1
ご回答ありがとうございます。そのモデルは、よりよく適合するだけでなく、いくつかの点でより理にかなっています。
Don Dresser LatentView 2014年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.