残差の自己相関をテストする方法は?


23

多くの価格(750)を持つ2つの列を持つマトリックスがあります。以下の画像では、次の線形回帰の残差をプロットしました。

lm(prices[,1] ~ prices[,2])

画像を見ると、残差の非常に強い自己相関があるようです。

しかし、これらの残差の自己相関が強いかどうかをどのようにテストできますか?どの方法を使用すればよいですか?

線形回帰の残差

ありがとうございました!


8
自己相関をテストする必要はありません。そこにあります。プロットはそれを示しています。これらの残差の自己相関関数(関数acf())を見ることができますが、これは単純な目で見ることができるものを確認するだけです。時間差残差間の相関は非常に高いです。
ウルフギャング

@Wolfgang、はい、正しいですが、プログラムで確認する必要があります。acf関数を見ていきます。ありがとう!
デール

@ Wolfgang、acf()が表示されていますが、強い相関があるかどうかを理解するための一種のp値が表示されません。結果をどのように解釈しますか?ありがとう
-Dail

H0:相関(r)= 0の場合、rは、平均0、分散sqrt(観測数)のnormal / t distに従います。あなたは+/-を使用して95%信頼区間を得ることができるようにqt(0.75, numberofobs)/sqrt(numberofobs)
ジム・

@Jim相関の分散ははありません 。標準偏差もありません。ただし、れています。nnn
Glen_b-モニカーの復帰2014

回答:


17

これを行うにはおそらく多くの方法がありますが、最初に思い浮かぶのは線形回帰に基づいています。連続する残差を互いに回帰させ、有意な勾配をテストできます。自己相関がある場合、連続する残差間に線形関係があるはずです。作成したコードを完成させるには、次のようにします。

mod = lm(prices[,1] ~ prices[,2])
res = mod$res 
n = length(res) 
mod2 = lm(res[-n] ~ res[-1]) 
summary(mod2)

mod2は、時間誤差に対する時間誤差線形回帰です。res [-1]の係数が有意であれば、残差に自己相関の証拠があります。tεtt1εt1

注:これは、暗黙的に残差だけという意味で自己回帰であることを前提とし予測する際に重要であるε Tを。実際には、より長い範囲の依存関係が存在する可能性があります。その場合、私が説明したこの方法は、εの真の自己相関構造に対する1ラグの自己回帰近似として解釈される必要があります。εt1εtε


例に感謝します。疑問が1つだけあります。res[-1]が重要かどうかをテストするにはどうすればよいですか
デール

他の回帰係数と同じ方法でテストします統計とp値を見てください。tp
マクロ:

lm(rnorm(1000)〜jitter(1:1000))で高速テストを実行:残差標準誤差:997自由度で1.006 :0.3454 DF、p値1にして997:0.5569 p値は、帰無仮説棄却することはできません
デール

マクロ、上でプロットしたチャートの残差をテストしました。結果は次のとおりです。残差標準誤差:自由度747で0.04514複数のR 2乗:0.9241、調整済みR 2乗:0.924 F統計:1で9093および747 DF、p値:<2.2e-16、あまり良くないようです、強い自己相関があるので非常に奇妙です、私は何ができますか?
28:44にデイル

3
これは、自己相関のBreusch-Godfreyテストと呼ばれます。
チャーリー

16

lmtestパッケージに実装されているDurbin-Watsonテストを使用します。

dwtest(prices[,1] ~ prices[,2])

私は非常に奇妙な:p値<2.2e-16、それはどのように可能ですか?データは非常に相関しているようです!
デール

4
p値は、おそらく実際の相関がない場合に観測される相関と同じくらいの相関を取得することです。したがって、pが非常に小さい場合は、サンプルに多くの相関関係があることが示唆されます。
ロブハインドマン

このようなp値は、残差が非常に自己相関していることを示していますか?
29:11にデイル

うーん、奇妙なことに、imageshack.us / f / 59 / 17671620.pngを見てください。正しい画像が自己相関していない可能性はありますか?
デール

:dail左の画像の分散に構造的変化があるようです(詳細については、Ruey Tsayの記事「外れ値、レベルシフト、時系列の分散の変化」、Journal of Forecasting、VOl 7、1-20(1988)を参照してください)この場合DWを「混乱」させないのは、おそらく分布全体がまだ正常であるのに対し、右の画像には視覚的に明らかな(経験的に識別可能な)異常(パルス)があり、非正常(レプトクティックのwikopedia:A分布を参照)正の過剰尖度は
レプトクルティック

11

DWテストまたは線形回帰テストは、データの異常に対してロバストではありません。パルス、季節性パルス、レベルシフト、またはローカルタイムトレンドがある場合、これらのテストは役に立たないのは、これらの未処理のコンポーネントがエラーの分散を膨らませ、テストに下向きのバイアスをかけ、(あなたが知っているように)の帰無仮説を誤って受け入れるようにするためです自己相関。これらの2つのテストまたは私が知っている他のパラメトリックテストを使用する前に、残差の平均が0.0から0.0の統計的に有意な差がないことを「証明」する必要があります。DWテストの制約の1つは、回帰エラーが正規分布しているという仮定であることはよく知られています。正常に分散された手段は、特に他のことに注意してください:異常なし(を参照http://homepage.newschool.edu/~canjels/permdw12.pdf)。さらに、DWテストはラグ1の自己相関のみをテストします。データは毎週/季節的な影響を与える可能性があり、これは診断されず、さらに未処理になるとDWテストに下向きのバイアスがかかります。


残差がゼロと有意に異なることをテストするためのテストは何ですか?回帰にインターセプトが含まれる場合、残差平均は代数ゼロであるため、この問題をどのように回避できるのか興味があります。
mpiktas

:mpkitas定数を含めると、エラーの平均は0.0であることが保証されますが、エラーの平均がどこでもゼロであることは保証されません。たとえば、シリーズの平均に変化がある場合、全体の平均は定数になりますが、それぞれ異なる平均を持つtw0の残差の「塊」が生成されます。詳細については、Ruey Tsayの記事「Outliers、Level Shifts、Variance Changes in Time Series」、Journal of Forecasting、VOl 7、1-20(1988)を参照してください。またはfaculty.chicagobooth.edu/ruey.tsay/teaching/uts/lec10-08.pdfまたはGoogle「自動介入検出」
-IrishStat

1
これは、すべての回帰分析で暗黙的である、標準の「省略された変数なし」の仮定です。
チャーリー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.