Rのur.df(Dickey-Fullerユニットルートテスト)の結果の解釈


11

パッケージのur.df()関数を使用して、時系列で次の単体ルートテスト(Dickey-Fuller)を実行していurcaます。

コマンドは次のとおりです。

summary(ur.df(d.Aus, type = "drift", 6))

出力は次のとおりです。

############################################### 
# Augmented Dickey-Fuller Test Unit Root Test # 
############################################### 

Test regression drift 


Call:
lm(formula = z.diff ~ z.lag.1 + 1 + z.diff.lag)

Residuals:
      Min        1Q    Median        3Q       Max 
-0.266372 -0.036882 -0.002716  0.036644  0.230738 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)   
(Intercept)  0.001114   0.003238   0.344  0.73089   
z.lag.1     -0.010656   0.006080  -1.753  0.08031 . 
z.diff.lag1  0.071471   0.044908   1.592  0.11214   
z.diff.lag2  0.086806   0.044714   1.941  0.05279 . 
z.diff.lag3  0.029537   0.044781   0.660  0.50983   
z.diff.lag4  0.056348   0.044792   1.258  0.20899   
z.diff.lag5  0.119487   0.044949   2.658  0.00811 **
z.diff.lag6 -0.082519   0.045237  -1.824  0.06874 . 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Residual standard error: 0.06636 on 491 degrees of freedom
Multiple R-squared: 0.04211,    Adjusted R-squared: 0.02845 
F-statistic: 3.083 on 7 and 491 DF,  p-value: 0.003445 


Value of test-statistic is: -1.7525 1.6091 

Critical values for test statistics: 
      1pct  5pct 10pct
tau2 -3.43 -2.86 -2.57
phi1  6.43  4.59  3.78
  1. 有意性コード(Signif。コード)はどういう意味ですか?それらのいくつかがz.lag.1、z.diff.lag.2、z.diff.lag.3(「。」有意コード)およびz.diff.lag.5(「 ** "有意コード)。

  2. 出力から、検定統計量の2つの値、-1.7525と1.6091が得られます。ADFテスト統計が最初の統計(つまり-1.7525)であることを知っています。では、2つ目は何ですか。

  3. 最後に、95%の有意水準で単位根の仮説を検定するために、ADF検定統計(つまり-1.7525)を、通常は表から取得する臨界値と比較する必要があります。ここの出力は、私に重要な値を与えているようです。ただし、問題は、「tau2」と「phi1」の間のどの臨界値を使用すればよいかです。

お返事ありがとうございます。


1-記号コードは明確である必要があります...ラグには二重の星があるため、p = 0.01です2-それらは異なるH0をテストします:「なし」または「ドリフト」または「トレンド」3-重要な値、同じことは、どのH0を検討するか
joint_p

@joint_p申し訳ありませんが、私は初心者です。あなたの答えは非常に簡単でした。あなたが言ったことについてもう少し詳しく説明してもらえますか?とても感謝しております。ありがとうございました。
SavedByJESUS

amazon.com/Analysis-Integrated-Cointegrated-Time-Use/dp/…これは非常に良い本です。私はそれを使って勉強していました
joint_p

回答:


16

この特定のRコマンドの作成者は、元のDickey-Fullerの式に精通していると想定しているため、値の解釈方法に関する関連ドキュメントを提供していません。私はエンダースが非常に役立つリソースであることを発見しました(Applied Econometric Time Series 3e、2010、p。206-209-他のエディションも問題ないと思います)。以下では、例としてデンマークの実質所得であるURCAパッケージのデータを使用します。

> income <- ts(denmark$LRY)

Dickey-Fullerがur.dfの「タイプ」オプションと一致するため、異なる仮説を取得するために使用される3つの異なる数式を最初に説明すると役立つ場合があります。エンダースは、これら3つのケースのすべてで、一貫した用語として、ガンマ、以前のyの値の係数、ラグ項を使用することを指定しています。gamma = 0の場合、単位根があります(ランダムウォーク、非定常)。帰無仮説がgamma = 0の場合、p <0.05の場合、帰無(95%レベル)を棄却し、単位根がないと仮定します。nullを拒否できなかった場合(p> 0.05)、単位根が存在すると推定します。ここから、タウとファイの解釈に進むことができます。

Δy(t)=γy(t1)+e(t)

e(t)γ=a1y=ay(t1)+e(t)y(t1)

type = "none"の場合、tau(またはR出力のtau1)は、ガンマ= 0の帰無仮説です。デンマークの所得の例を使用すると、 "Value of test-statistic is 0.7944"となり、 "Test statisticsの重要な値は:tau1 -2.6 -1.95 -1.61。テスト統計がnullを拒否できない3つの領域すべて(1%、5%、10%)内にある場合、データはランダムウォークであると想定する必要があります。単位根が存在します。この場合、tau1はガンマ= 0の仮説を参照します。「z.lag1」はガンマ項、ラグ項の係数(y(t-1))です。これはp = 0.431は有意であるとして拒否できず、単にガンマがこのモデルに対して統計的に有意ではないことを意味します。Rからの出力は次のとおりです。

> summary(ur.df(y=income, type = "none",lags=1))
> 
> ############################################### 
> # Augmented Dickey-Fuller Test Unit Root Test # 
> ############################################### 
> 
> Test regression none 
> 
> 
> Call:
> lm(formula = z.diff ~ z.lag.1 - 1 + z.diff.lag)
> 
> Residuals:
>       Min        1Q    Median        3Q       Max 
> -0.044067 -0.016747 -0.006596  0.010305  0.085688 
> 
> Coefficients:
>             Estimate Std. Error t value Pr(>|t|)
> z.lag.1    0.0004636  0.0005836   0.794    0.431
> z.diff.lag 0.1724315  0.1362615   1.265    0.211
> 
> Residual standard error: 0.0251 on 51 degrees of freedom
> Multiple R-squared:  0.04696,   Adjusted R-squared:  0.009589 
> F-statistic: 1.257 on 2 and 51 DF,  p-value: 0.2933
> 
> 
> Value of test-statistic is: 0.7944 
> 
> Critical values for test statistics: 
>      1pct  5pct 10pct
> tau1 -2.6 -1.95 -1.61

Δy(t)=a0+γy(t1)+e(t)

γ=0γ=0
phi1項は、2番目の仮説を指します。これは、a0 =ガンマ= 0の帰無仮説を組み合わせたものです。これは、値の両方が同時に0であることがテストされることを意味します。p <0.05の場合、nullを拒否し、これらの少なくとも1つが偽であると仮定します。つまり、a0またはgammaのいずれかまたは両方が0ではありません。このnullを拒否しないと、a0とgamma = 0の両方がつまり、1)ガンマ= 0で単位根が存在し、かつ2)a0 = 0であるため、ドリフト項はありません。こちらがR出力

> summary(ur.df(y=income, type = "drift",lags=1))
> 
> ############################################### 
> # Augmented Dickey-Fuller Test Unit Root Test # 
> ############################################### 
> 
> Test regression drift 
> 
> 
> Call:
> lm(formula = z.diff ~ z.lag.1 + 1 + z.diff.lag)
> 
> Residuals:
>       Min        1Q    Median        3Q       Max 
> -0.041910 -0.016484 -0.006994  0.013651  0.074920 
> 
> Coefficients:
>             Estimate Std. Error t value Pr(>|t|)
> (Intercept)  0.43453    0.28995   1.499    0.140
> z.lag.1     -0.07256    0.04873  -1.489    0.143
> z.diff.lag   0.22028    0.13836   1.592    0.118
> 
> Residual standard error: 0.0248 on 50 degrees of freedom
> Multiple R-squared:  0.07166,   Adjusted R-squared:  0.03452 
> F-statistic:  1.93 on 2 and 50 DF,  p-value: 0.1559
> 
> 
> Value of test-statistic is: -1.4891 1.4462 
> 
> Critical values for test statistics: 
>       1pct  5pct 10pct
> tau2 -3.51 -2.89 -2.58
> phi1  6.70  4.71  3.86

Δy(t)=a0+gammay(t1)+a2(t)+e(t)

(ここでa2(t)は時間トレンドの項です)(Enders p。208からの)仮説は次のとおりです:tau:gamma = 0 phi3:gamma = a2 = 0 phi2:a0 = gamma = a2 = 0これはR出力。この場合、テスト統計は-2.4216 2.1927 2.9343です。これらすべてのケースで、これらは「nullを拒否できない」ゾーンに含まれます(以下の重要な値を参照)。上記のように、tau3が意味するのは、ユニットルートのnullを拒否できず、ユニットルートが存在することを意味します。phi3を拒否しないことは、2つのことを意味します。1)ガンマ= 0(単位根)AND 2)時間トレンド項がない、つまり、a2 = 0。このnullを拒否した場合、これらの項の1つまたは両方が0ではなかったことを意味します。phi2を拒否しないことは、3つのことを意味します。1)ガンマ= 0および2)時間トレンド項なしおよび3)ドリフト項なし、つまり= 0、a0 = 0、a2 = 0。
こちらがR出力

> summary(ur.df(y=income, type = "trend",lags=1))
> 
> ############################################### 
> # Augmented Dickey-Fuller Test Unit Root Test # 
> ############################################### 
> 
> Test regression trend 
> 
> 
> Call:
> lm(formula = z.diff ~ z.lag.1 + 1 + tt + z.diff.lag)
> 
> Residuals:
>       Min        1Q    Median        3Q       Max 
> -0.036693 -0.016457 -0.000435  0.014344  0.074299 
> 
> Coefficients:
>               Estimate Std. Error t value Pr(>|t|)  
> (Intercept)  1.0369478  0.4272693   2.427   0.0190 *
> z.lag.1     -0.1767666  0.0729961  -2.422   0.0192 *
> tt           0.0006299  0.0003348   1.881   0.0659 .
> z.diff.lag   0.2557788  0.1362896   1.877   0.0665 .
> ---
> Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> 
> Residual standard error: 0.02419 on 49 degrees of freedom
> Multiple R-squared:  0.1342,    Adjusted R-squared:  0.08117 
> F-statistic: 2.531 on 3 and 49 DF,  p-value: 0.06785
> 
> 
> Value of test-statistic is: -2.4216 2.1927 2.9343 
> 
> Critical values for test statistics: 
>       1pct  5pct 10pct
> tau3 -4.04 -3.45 -3.15
> phi2  6.50  4.88  4.16
> phi3  8.73  6.49  5.47

上記の特定の例では、d.Ausデータの場合、両方の検定統計量が「不合格失敗」ゾーン内にあるため、gamma = 0 AND a0 = 0であることを意味し、単位根があることを意味しますが、ドリフト項はありません。


@ジェレミー、詳細な回答パート3(傾向あり)で、「この場合、テスト統計は-2.4216 2.1927 2.9343です。これらすべてのケースで、これらは「nullを拒否できません」ゾーンに含まれます(クリティカルを参照)以下の値)。」私の質問は、2.1927がphi2の検定統計量である場合、phi2 6.50 4.88 4.16に対してチェックする必要がありますか?それが正しい場合、phi2 H0(トレンドとドリフトのない単位根)を受け入れる条件は何ですか?
サラズ

5

joint-pがすでに指摘したように、有意性コードはかなり標準的であり、p値、つまり仮説検定の統計的有意性に対応します。0.01のp値は、結論が99%の信頼度内で真であることを意味します。

Dickey-Fullerに関するWikipediaの記事では、Dickey-Fullerテストの3つのバージョンについて説明しています。「単位根」、「ドリフトのある単位根」、「ドリフトのある単位根と決定論的な時間トレンド」、またはurcatype = "none"、 "drift"、および "trend"としてのドキュメント。

これらの各テストは、徐々に複雑になる線形回帰です。それらのすべてにルートがありますが、ドリフトにはドリフト係数もあり、トレンドにはトレンド係数もあります。これらの各係数には、関連する有意水準があります。ルート係数の有意性が最も重要であり、DFテストの主な焦点ですが、傾向/ドリフトが統計的に有意であるかどうかについても知りたい場合があります。さまざまなモードをいじくり回して、どの係数がt検定に現れる/消えるかを確認した後、どの係数がどのt検定に対応するかを簡単に識別できました。

それらは次のように書くことができます(wikiページから):

Δyt=δyt1+ut

Δyt=δyt1+a0+ut

Δyt=δyt1+a0+a1t+ut

δa0a1δa0a1


1

Dickey Fullerテストの概要

ユニットルートテストに関するロジャーパーマンの講義ノートの詳細

これらのテスト統計が参照するさまざまな仮説をまとめた、エンダースのApplied Econometric Time Series(4e)の表4.2も参照してください。コンテンツは上記の画像に同意します。


1

私はジェラミーの答えを理解するのは非常に簡単であることがわかりましたが、私は常に自分がロジックを正しく歩き、間違いを犯そうとしていることに気づきました。3つのタイプのモデルのそれぞれを解釈するR関数をコード化し、不一致または不確定な結果がある場合は警告を出します(ADFの数学を正しく理解していれば、不一致があるはずはないと思いますが、それでも良いと思いましたur.df関数に欠陥があるかどうかを確認してください)。

ぜひご覧ください。コメント/修正/改善をうれしく思います。

https://gist.github.com/hankroark/968fc28b767f1e43b5a33b151b771bf9


関数は、多くの努力を払って作成されたように見えます。ただし、再現可能な例を追加すると役立ちます。時系列(おそらくRまたはパッケージですでに利用可能なもの)を選び、それに対してdickey fullerテストを実行し、関心のある人だけがその機能を確認できるように関数を使用できます。
SavedByJESUS

0

非常に興味深い投稿と回答。user3096626によって説明されたテーブルに関して、私はただ疑っています。どのソフトウェアがADFテスト出力での値を報告し\tau_{\alpha \mu}\tau_{\alpha \tau}そして\tau_{\beta \tau}?明らかに、Rは


-4

phi1 phi2 phi3は、ADFフレームワークのF検定と同等です。


4
この答えを少し拡張できますか?現時点ではそれはやや不可解です。なぜこれらは同等でなければならないのですか?
Andy
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.