AIC統計の値が最小値の特定のしきい値内にあるモデルは、AIC統計を最小化するモデルとして適切であると見なす必要があることは、少なくとも一部の高水準の統計家の間で十分に確立されています。たとえば、[1、p.221]には、
次に、GCVまたはAICが小さいモデルが最適です。もちろん、GCVやAICを盲目的に最小化すべきではありません。むしろ、適度に小さいGCVまたはAIC値を持つすべてのモデルは、潜在的に適切であると見なされ、その単純さと科学的関連性に従って評価されるべきです。
同様に、[2、p.144]には、
最小値のc以内のAIC値を持つモデルは、競争力があると見なすべきであると提案されています(Duong、1984)(c = 2を典型的な値として)。競合モデルからの選択は、残差の白色度(セクション5.3)やモデルの単純さなどの要因に基づいて行うことができます。
参照:
- ルパート、D。ワンド、MP&キャロル、RJ セミパラメトリック回帰、ケンブリッジ大学出版局、2003年
- ブロックウェル、PJ&デイビス、RA 時系列と予測入門、ジョンワイリー&サンズ、1996
それでは、上記を踏まえて、以下の2つのモデルのどちらを優先する必要がありますか?
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
より一般的には、AICまたは関連する統計を盲目的に最小化することによってモデルを選択することが適切なのはいつですか?