単位根のないシリーズが非定常である素晴らしい例？

拡張されたDickey-Fullerテストでnullを拒否する人が数回いるのを見て、シリーズが静止していることを主張しています（残念ながら、これらの主張の出所を示すことはできませんが、 1つまたは別のジャーナル）。

私はそれが誤解であると主張します（ユニットルートのヌルの拒否は、特にそのようなテストが行われたときに非定常性の代替形式がめったに調査または検討さえされないため、必ずしも定常級数を持つことと同じではありません）。

私が求めるのは次のいずれかです。

a）主張に対する良い明確な反例（私は今、カップルを想像することができますが、私以外の誰かが私が考えているものよりも良いものを持っていると確信しています）。おそらくデータ（シミュレーションまたは実物。両方とも利点があります）を使用した特定の状況の説明です。または

b）増強されたディッキーフラーでの拒絶が定常性の確立と見なされるべきである理由を説得力のある議論

（または、（a）と（b）の両方が賢いと感じている場合）

— Glen_b -Reinstate Monica
ソース

X_{n} = (- 1)^{n}

$X_n = (-1)^n$ 確率1。–

— 枢機

@cardinalまあ、それは確かにADFテストによって拒否されます（編集：うん、そうです）、それは明らかに非定常です（単位円上のルートですが、ADFが検出する1に等しいルートではありません）; それでカウントされます。

— Glen_b -Reinstateモニカ

ADFテストには、傾向が含まれるバリアントがあることに注意してください。ヌルが拒否された場合、系列はトレンドが固定されます。つまり、トレンドが削除されると静止しますが、それでも静止ではありません。

— mpiktas

+1。Glen_b、線形トレンド+定常AR（1）ノイズは反例としてカウントされますか？

— アメーバは、モニカーを復活させる

回答:

ホワイトノイズテストでさえ検出できない非定常シリーズの例を次に示します（Dickey-Fullerタイプのテストは言うまでもありません）。

はい、これは驚くかもしれませんが、これはホワイトノイズではありません。

ほとんどの非定常カウンターの例は、定常の最初の2つの条件（決定論的傾向（非一定の平均）または単位根/不均一時系列（非一定の分散））の違反に基づいています。しかし、あなたはまた、一定の平均と分散を持つ非定常プロセスを持つことができますが、彼らは第三条件違反：自己共分散関数（ACVF）時間をかけて定数との関数であるべきのみ。 $cov(x_s, x_t)$ $|s-t|$

上記の時系列は、そのような系列の例であり、平均値、単位分散はゼロですが、ACVFは時間に依存します。より正確には、上記のプロセスは、それがなるようにパラメータを使用して局所的に固定MA（1）プロセスであるスプリアス白色雑音 MAプロセスのパラメータ（下記参考文献を参照）上の変化時間 $x_t = \varepsilon_t + \theta_1 \varepsilon_{t-1}$

θ_{1} (u) = 0.5 - 1 \cdot u,

$\theta_1(u) = 0.5 - 1 \cdot u,$

ここで、は正規化された時間です。これがホワイトノイズのように見える理由は（数学的には明らかにそうではありませんが）、時間変動ACVFが時間とともにゼロに積分されるためです。サンプルACVFは平均ACVFに収束するため、これはサンプルの自己共分散（および自己相関（ACF））がホワイトノイズのように見える関数に収束することを意味します。そのため、Ljung-Boxテストでさえ、この非定常性を検出することはできません。局所的に静止した代替物に対するホワイトノイズのテストに関する論文（免責：私は著者）は、そのような局所的に静止したプロセスに対処するためのBoxテストの拡張を提案しています。 $u = t/ T$

Rコードと詳細については、このブログ投稿も参照してください。

mpiktasコメントの後の更新：

これは、実際には見られない理論的に興味深いケースのように見えるかもしれません。実世界のデータセットでこのような偽のホワイトノイズを直接見ることはほとんどありませんが、定常モデルの近似のほとんどすべての残差でこれを見ることができます。あまり理論的な詳細に入るがなければ、単に一般的、時間的に変化するモデル想像時間的に変化する共分散関数と。あなたが一定のモデル合う場合は、この推定値は近い真のモデルの時間平均になります ; そして当然、残差は近くになります $\theta(u)$ $\gamma_{\theta}(k, u)$ $\widehat{\theta}$ $\theta(u)$ の建設により、（約）ゼロに出て統合されます。詳細については、Goerg（2012）を参照してください。 $\theta(u) - \widehat{\theta}$ $\widehat{\theta}$

例を見てみましょう

library(fracdiff)
library(data.table)

tree.ring <- ts(fread(file.path(data.path, "tree-rings.txt"))[, V1])
layout(matrix(1:4, ncol = 2))
plot(tree.ring)
acf(tree.ring)
mod.arfima <- fracdiff(tree.ring)
mod.arfima$d


## [1] 0.236507

私たちは、パラメータと小数ノイズに合わせて（以降我々は考えてすべてがうまくであり、我々は定常モデルを持っています）。残差を確認しましょう： $\widehat{d} = 0.23$ $\widehat{d} < 0.5$

arfima.res <- diffseries(tree.ring, mod.arfima$d)
plot(arfima.res)
acf(arfima.res)

良さそうですか？問題は、残差が偽のホワイトノイズであるということです。どうやって知るの？まず、テストできます

Box.test(arfima.res, type = "Ljung-Box")
## 
##  Box-Ljung test
## 
## data:  arfima.res
## X-squared = 1.8757, df = 1, p-value = 0.1708

Box.test.ls(arfima.res, K = 4, type = "Ljung-Box")
## 
##  LS Ljung-Box test; Number of windows = 4; non-overlapping window
##  size = 497
## 
## data:  arfima.res
## X-squared = 39.361, df = 4, p-value = 5.867e-08

2つ目は、年輪データが実際には局所的に定常的な非整数ノイズであることを文献から知っています。Goerg（2012）およびFerreira、Olea、and Palma（2013）を参照してください。

これは、私の-確かに-理論的に見える例が、実際のほとんどの例で実際に発生していることを示しています。

— ゲオルグ・M・ゴーグ
ソース

+1、とてもいい例です！そのようなシリーズの実際の例はありますか？

— mpiktas

@mpiktas投稿にあなたの質問に答えるべきアップデートを追加しました。

— ジョージM.ゴーグ16年

γ_{1} (u) = θ (u)

$\gamma_1(u)=\theta(u)$

σ (u) σ (u - 1 / T) θ (u)

$\sigma(u)\sigma(u-1/T)\theta(u)$

{\hat{γ}}_{1}

$\hat\gamma_1$

\int_{0}^{1} θ (u) d u = 0

$\int_0^1\theta(u)du=0$

\int_{0}^{1} θ (u) σ^{2} (u) d u = 0

$\int_0^1\theta(u)\sigma^2(u)du=0$

σ (u)

$\sigma(u)$

θ (u)

$\theta(u)$

ε_{t}

$\varepsilon_t$

あなたの与えられた例は、時変モデルがあるとき、非時変モデルをあてはめると間違った推論につながると言います。しかし、これは、各リアルタイムシリーズを時変モデルでモデル化できるということからはほど遠いものです。一方、テストは時間変動の存在をテストするために適用できます。興味深い洞察を再びありがとう。

— mpiktas

σ (u)^{2}

$\sigma(u)^2$

0.5

$0.5$

T \to \infty

$T \rightarrow \infty$

例1

強い負のMAコンポーネントを持つユニットルートプロセスは、公称サイズよりもはるかに大きい経験的サイズのADFテストにつながることが知られています（例、Schwert、JBES 1989）。

Y_{t} = Y_{t - 1} + ϵ_{t} + θ ϵ_{t - 1},

$Y_t=Y_{t-1}+\epsilon_t+\theta\epsilon_{t-1},$

θ \approx - 1

$\theta\approx-1$

$T(\hat\rho-1)$

library(urca)
reps <- 1000
n <- 100
rejections <- matrix(NA,nrow=reps)

for (i in 1:reps){
  y <- cumsum(arima.sim(n = n, list(ma = -0.98)))
  rejections[i] <- (summary(ur.df(y, type = "drift", selectlags="Fixed",lags=12*(n/100)^.25))@teststat[1] < -2.89)
}
mean(rejections)

例2

$Y_t$

差異の変化のタイプによっては、ADFテストは頻繁に拒否されます。以下の私の例では、下向きの分散ブレークがあります。これにより、テストは、シリーズが収束することを「信じる」ようにし、単位根のnullを拒否します。

library(urca)
reps <- 1000
n <- 100
rejections <- matrix(NA,nrow=reps)

for (i in 1:reps){
  u_1 <- rnorm(n/2,sd=5)
  u_2 <- rnorm(n/2,sd=1)
  u <- c(u_1,u_2)
  y <- arima.sim(n=n,list(ar = 0.8),innov=u)
  rejections[i] <- (summary(ur.df(y, type = "drift"))@teststat[1] < -2.89)      
}
mean(rejections)

（余談ですが、ADFテストは、無条件の不均一分散の存在下で、その重要な漸近的ヌル分布を「失います」。）

— クリストフ・ハンク
ソース

@Glen_b、それは（私が）あなたの最初の段落への答えかもしれないが、あなたの質問のタイトルへの本当の答えではないかもしれない-私の側に矛盾または理解の欠如がありますか？

— クリストフハンク

「それ」=例1

— クリストフハンク

これは、「ユニットルート」の定義に依存します。私はもともと「単位円上のルート」（モジュラス1のルート）としてそれを学びましたが、今では実際に1に等しい特性多項式のルートであるようです（ADFテストのコンテキストでは）。タイトルに間違った意味があったとしても、あなたの答えは意図した質問に答えているので、大丈夫だと思います。

— Glen_b -Reinstate Monica

私の要点はおそらく明確に表現されていません：タイトルでは「単位根のない」シリーズの例を探しますが、最初の段落（私にとって）は拒否が間違っている例を探すように聞こえます。最初の例は、後者の場合の例です。この場合、プロセスにはユニットルートがありますが、ADFは拒否する可能性があります。

— クリストフハンク

ああ、申し訳ありませんが、私はそれについて適切に考えていませんでした。はい、厳密にはどちらのタイトルの解釈とも一致していませんが、それでも本文のより広範な質問に対応しています。...

— Glen_b -Remonstate Monica

ユニットルートのテストは難しいことで有名です。通常、1つのテストを使用するだけでは十分ではないため、テストが使用している正確な仮定に注意する必要があります。

ADFの構築方法により、ホワイトノイズが追加された単純な非線形トレンドであるシリーズに対して脆弱になります。以下に例を示します。

library(dplyr)
library(tseries)
set.seed(1000)
oo <- 1:1000  %>% lapply(function(n)adf.test(exp(seq(0, 2, by = 0.01)) + rnorm(201)))
pp <- oo %>% sapply("[[","p.value")

> sum(pp < 0.05)
[1] 680

ここで、指数的な傾向があり、ADFのパフォーマンスが非常に低いことがわかります。ユニットルートのヌルを30％の時間受け入れ、70％の時間を拒否します。

通常、分析の結果は、系列が静止しているかどうかを主張することではありません。分析で使用される方法に定常性が必要な場合、系列が実際には静止していても静止しているという誤った仮定は、通常何らかの形で現れます。そこで、私は個人的にはユニットルートテストの部分だけでなく、分析全体を見ていきます。たとえば、OLSとNLSは、非定常性が平均、つまり傾向にある非定常性データに対して正常に機能します。したがって、誰かがシリーズが静止していると誤って主張し、OLS / NLSを適用する場合、この主張は関連しない可能性があります。

— mpiktas
ソース

p > 0.05

$p>0.05$

ああ、私は兆候を混同しました。それに応じて答えを修正しました。気づいてくれてありがとう！

— mpiktas

なぜ使わなかったのsapply(oo, "[[","p.value")？

— germcd

まあ、パイプ構文でのみ使用しました。私はパイプが好きです:)

— mpiktas

私もdplyrが好きです。このコードでは不要です。magrittrをロードするだけで十分です。

— mpiktas