自己相関をテストする代わりに、なぜダービンワトソンを使用するのですか?


10

Durbin-Watson検定は、ラグ1での残差の自己相関をテストしますが、ラグ1での自己相関を直接テストします。さらに、ラグ2、3、4で自己相関をテストできます。複数のラグでの自己相関の適切なポートマンテストがあり、見やすく、簡単に解釈できるグラフ[Rのacf()関数など]を取得できます。ダービン・ワトソンは理解するのが直感的ではなく、しばしば決定的な結果を生み出しません。では、なぜそれを使用するのでしょうか。

これは、ダービン・ワトソン検定の決定に関するこの質問に触発されましたが、それとは明らかに異なります。


1
あなたは実際に他の遅れのためにダービンワトソンを行うことができます。一般化されたダービン-ワトソン統計を調べます。
Brandon Sherman

回答:


8

このスレッドおよび他のスレッドで前に指摘したように、(1)ダービン・ワトソン検定は決定的ではありません。ダービンとワトソンが最初に提案した境界は、正確な分布が観測されたリグレッサ行列に依存するためでした。ただし、これは統計/計量経済学ソフトウェアで対処するのに十分簡単です。(2)Durbin-Watson検定は、より高いラグに一般化されています。したがって、ラグの決定性も制限も、ダービン・ワトソン検定に対する反論ではありません。

遅れ従属変数のWald検定と比較して、Durbin-Watson検定は、特定のモデルでより高い検出力を持つことができます。具体的には、モデルに確定的傾向または季節性パターンが含まれている場合、遅延応答(確定的パターンにまだ調整されていない)を含めるよりも、残差の自己相関をテストする方がよい(ダービン-ワトソン検定と同様)。 。以下に小さなRシミュレーションを含めます。

Durbin-Watson検定の1つの重要な欠点は、自己回帰効果が既に含まれているモデルには適用できないことです。したがって、自己回帰モデルで部分的に取り込んだ後、残余自己相関をテストすることはできません。そのシナリオでは、Durbin-Watson検定の能力は完全に崩壊する可能性がありますが、たとえばBreusch-Godfrey検定の場合はそうではありません。私たちの著書「Applied Econometrics with R」には、「独自の分析のプログラミング」の章でこれを示す小さなシミュレーション研究があります。http://eeecon.uibk.ac.at/~zeileis/teaching/AER/を参照してください

傾向と自己相関エラーを含むデータセットの場合、ダービンワトソン検定の検出力はBreusch-Godfrey検定の場合よりも高く、自己回帰効果のWald検定の場合よりも高くなります。Rの簡単な小さなシナリオでこれを説明します。そのようなモデルから50の観測を引き出し、3つのテストすべてのp値を計算します。

pvals <- function()
{
  ## data with trend and autocorrelated error term
  d <- data.frame(
    x = 1:50,
    err = filter(rnorm(50), 0.25, method = "recursive")
  )

  ## response and corresponding lags
  d$y <- 1 + 1 * d$x + d$err
      d$ylag <- c(NA, d$y[-50])

  ## OLS regressions with/without lags
  m <- lm(y ~ x, data = d)
  mlag <- lm(y ~ x + ylag, data = d)

  ## p-value from Durbin-Watson and Breusch-Godfrey tests
  ## and the Wald test of the lag coefficient
  c(
    "DW" = dwtest(m)$p.value,
        "BG" = bgtest(m)$p.value,
    "Coef-Wald" = coeftest(mlag)[3, 4]
  )
}

次に、3つのモデルすべてについて1000のp値をシミュレートできます。

set.seed(1)
p <- t(replicate(1000, pvals()))

Durbin-Watson検定は、平均p値が最も低くなる

colMeans(p)
##        DW        BG Coef-Wald 
## 0.1220556 0.2812628 0.2892220 

5%の有意水準で最大のパワー:

colMeans(p < 0.05)
##        DW        BG Coef-Wald 
##     0.493     0.256     0.248 

そのため、DW統計のもう1つの制限は、モデルが既に自己相関を制御しようとしている場合は使用できないことです。DWがWaldまたはBreusch-Godfrey(どちらも使用していません)よりも強力であるという事実に感謝しますが、私の通常の比較は、Ljung-Boxのようなportmanteauテストと、0のnullと比較した個々の自己相関です。これは、教科書を予測する際の典型的な制度です。
zbicyclist 2015年

2
これは実際には別の制限IMOではなく、主な制限です。その他の問題(範囲やラグ数ではなくp値の計算)を処理できます。検出力の解釈には注意してください。この特定のモデルでは、AR(1)誤差項のある確定的傾向-ダービン-ワトソン検定の方が検出力が高いと述べました。これは、他の多くのセットアップでは当てはまらない場合があります。そして、Ljung-Box検定については、そうです。これは、ARIMAモデルをフィッティングした後に残存する自己相関をチェックする古典的な検定です。
Achim Zeileis、2015年

3

ダービン・ワトソン検定は、自己相関をテストする方法です。ACFのプロットは、QQプロットを作成して正規性をテストするようなものです。QQプロットを目視して正規性をテストできると便利ですが、コルモゴロフ-スミルノフまたはレベンテストは、正規性の仮説テストの方が決定的であるため、プロットに表示されるものを補足します。

複数のラグについては、一般化されたダービンワトソン統計を使用して、いくつかの仮説検定を実行し、ボンフェローニ修正を行って複数の検定を修正できます。任意の順序の相関の存在をテストするBreusch-Godfreyテストを実行することもできます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.