時系列モデルで適切な遅延順序を選択するために、情報基準(調整されたはない)が使用されるのはなぜですか?


9

ARMA-GARCHのような時系列モデルでは、モデルの適切なラグまたは順序を選択するために、AIC、BIC、SICなどのさまざまな情報基準が使用されます。

私の質問は非常に単純です、なぜ適切なモデルを選択するために調整されたを使用しないのですか?調整後の値が高くなるモデルを選択できます。調整された両方のために前者PENALIZEモデルにおける説明変数の追加数の情報量基準PENALIZE以降PENALIZE尤度値。 R2R2R2R2


回答(以下)に何か欠けている可能性がありますが、R二乗と調整済みR二乗は、比較的限定されたクラスのOLS推定モデルに適していますが、AIC、BICなどは、より広いクラスの一般化線形に適していますMLまたはバリアントを使用して推定されたモデル。
マイクハンター

回答:


12

少なくとも線形モデル(ARモデルなど)を論じる場合、調整されたとAICはそれほど変わらないと私は主張します。R2

をに含める かどうかの質問を検討してください。 これは、モデル ここで、。私たちは、と言うある真のモデルならば。注意してください。したがって、モデルはネストされます。モデル選択手順は、複数のモデルの中で最ももっともらしいものを選択するデータ依存のルールです。、Y = X 1N × K 1 β 1 + X 2N × K 2 β 2 + ε M 1X2

y=X1(n×K1)β1+X2(n×K2)β2+ϵ
EU|X1X2=0M2β20M1M2 M
M1:y=X1β1+uM2:y=X1β1+X2β2+u,
E(u|X1,X2)=0M2β20M1M2M^

私たちは言う で一貫性のある場合は M^

limnP(M^=M1|M1)=1limnP(M^=M2|M2)=1

調整された検討してください。つまり、場合は選択します。単調に減少している、この手順は、最小化と等価である。これは、を最小化することと同じです。十分に大きな場合、後者はとして記述できます whereR2M1R¯12>R¯22R¯2s2s2log(s2)n

log(s2)=log(σ^2nnK)=log(σ^2)+log(1+KnK)log(σ^2)+KnKlog(σ^2)+Kn,
σ^2エラー分散のML推定量です。したがって、基づくモデル選択は、最小の持つモデルを選択することと漸近的に同等 です。この手順には一貫性がありません。R¯2log(σ^2)+K/n

命題

limnP(R¯12>R¯22|M1)<1

証明: 統計は漸近従う線形回帰の場合のLR統計であるため、最後から2番目の行が続きますヌル分布。QED

P(R¯12>R¯22|M1)P(log(s12)<log(s22)|M1)=P(nlog(s12)<nlog(s22)|M1)P(nlog(σ^12)+K1<nlog(σ^22)+K1+K2|M1)=P(n[log(σ^12)log(σ^22)]<K2|M1)P(χK22<K2)<1,
χK22

次に、赤池の基準、検討し したがって、AICは、追加のリグレッサによって暗示されるSSRの削減と「ペナルティ条件、 "反対方向を指します。したがって、場合は 選択し、そうでない場合は選択します。

AIC=log(σ^2)+2Kn
M1AIC1<AIC2M2

上記の証明を 3行目に続けると、にも一貫性がないことが。したがって、調整されたとは、が真のモデルである場合でも、正の確率で「大きな」モデルを選択します。AICP(nlog(σ^12)+2K1<nlog(σ^22)+2(K1+K2)|M1)R2AICM2M1

ただし、AICの複雑さのペナルティは、調整されたのペナルティよりも少し大きいため、過度に選択される可能性は低くなります。そして、それは私の投稿で扱われていない他の優れたプロパティ(検討されているモデルのセットにない場合は、真のモデルへのKLの発散を最小化する)を持っています。R2


1
正解:重すぎないが正確です!昨日あったなら、私は投稿しなかったでしょう。
リチャードハーディ

ARMA-GARCHの場合はどうですか?は、MAとGARCHの用語を選択するときにどのように使用しますか Radj2
ザカリーブルーメンフェルド2016

あえて言うつもりはありません。あなたが説明するように、そのようなモデルの適合のためにR2が何を意味するかさえ明確ではありません。
Christoph Hanck、2016

5

のペナルティは、AICまたはBICが提起するモデル選択の点で優れた特性をもたらしません。のペナルティは、回帰者が実際にモデルに属していない場合、母集団公平な推定量にするのに十分です(Dave Gilesのブログ投稿"In What Sense 「調整された」R-Squared Unbiased?」および「「調整された」決定係数の特性の詳細」); ただし、は最適なモデルセレクターではありません。Radj2Radj2Radj2R2Radj2

(矛盾による証明があるかもしれません:AICがある意味で最適でBICが別の意味で最適であり、がそれらのいずれとも同等でない場合、はどちらでも最適ではありませんこれら二つの感覚の。)Radj2Radj2


が増加する前にいくつのGARCHパラメータを追加する必要がありますか?:)....(MAモデルのように)相関誤差の仮定についても同様の議論ができると思います。GLSモデルは、通常の最小二乗法の残差の二乗和を減らしません。MAとGARCHの両方で、パラメータ(説明変数ではなく、が調整される)がモデルに追加されます。MAおよびGARCHパラメーターは、を削減するために追加されるのではなく、可能性を高めるために追加されたり、iidエラー項の欠如を反映するために2乗残差の加重和を減らしたりします。R2R2adjSSR
ザカリーブルーメンフェルド2016

これは実際に元の投稿または私の答えを扱っていますか?いずれにしても、私はあなたの主張に同意します。
リチャードハーディ

私は何を指摘しようとしていたことである本当にそれがの割合に基づいているので、(あまりにも、おそらくMAコンポーネント)GARCHコンポーネント時に選択するために使用することはできませんオーバー推定量をバイアスされていますエラー項がiidではない場合の分散 (これはあなたが話しているバイアスの特定のケースです)。ARMA-GARCHの場合、たとえが増加しないため、データに確率論的ボラティリティがあったとしても、GARCHコンポーネントを含むモデルを選択することはありません。基本的に、私は具体的な例を挙げようとすることであなたに同意します。Radj2SSTSSRSSTR2
ザカリーブルーメンフェルド2016
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.