2つの時系列間の関係:ARIMA


12

次の2つの時系列(xy、以下を参照)が与えられた場合、このデータの長期傾向間の関係をモデル化する最良の方法は何ですか?

両方の時系列は、時間の関数としてモデル化されたときに有意なダービン・ワトソン検定を持ち、どちらも定常ではありません(用語を理解しているように、またはこれは、残差で定常である必要があるだけですか?)。これは、基本的にはarima(1,1,0)を使用して、一方を他方の関数としてモデル化する前に、各時系列の1次の差(少なくとも、おそらく2次)を取得する必要があることを意味します。 )、arima(1,2,0)など

モデル化する前になぜトレンド除去する必要があるのか​​理解できません。自己相関をモデル化する必要性を理解していますが、なぜ差異化が必要なのかわかりません。私には、差分によるトレンド除去が、関心のあるデータの主要な信号(この場合は長期トレンド)を削除し、より高い周波数の「ノイズ」を残す(ノイズという用語を緩く使用する)ように見えます。確かに、ある時系列と別の時系列との間にほぼ完全な関係を作成し、自己相関がないシミュレーションでは、時系列を差分すると、関係検出の目的に対して直観に反する結果が得られます。たとえば、

a = 1:50 + rnorm(50, sd = 0.01)
b = a + rnorm(50, sd = 1)
da = diff(a); db = diff(b)
summary(lmx <- lm(db ~ da))

この場合、baと強く関連しいますが、bの方がノイズが多くなります。私にとってこれは、低周波信号間の関係を検出するための理想的なケースで差分が機能しないことを示してます。差分は時系列分析で一般的に使用されることを理解していますが、高周波信号間の関係を決定するために、より役立つようです。何が欠けていますか?

データの例

df1 <- structure(list(
x = c(315.97, 316.91, 317.64, 318.45, 318.99, 319.62, 320.04, 321.38, 322.16, 323.04, 324.62, 325.68, 326.32, 327.45, 329.68, 330.18, 331.08, 332.05, 333.78, 335.41, 336.78, 338.68, 340.1, 341.44, 343.03, 344.58, 346.04, 347.39, 349.16, 351.56, 353.07, 354.35, 355.57, 356.38, 357.07, 358.82, 360.8, 362.59, 363.71, 366.65, 368.33, 369.52, 371.13, 373.22, 375.77, 377.49, 379.8, 381.9, 383.76, 385.59, 387.38, 389.78), 
y = c(0.0192, -0.0748, 0.0459, 0.0324, 0.0234, -0.3019, -0.2328, -0.1455, -0.0984, -0.2144, -0.1301, -0.0606, -0.2004, -0.2411, 0.1414, -0.2861, -0.0585, -0.3563, 0.0864, -0.0531, 0.0404, 0.1376, 0.3219, -0.0043, 0.3318, -0.0469, -0.0293, 0.1188, 0.2504, 0.3737, 0.2484, 0.4909, 0.3983, 0.0914, 0.1794, 0.3451, 0.5944, 0.2226, 0.5222, 0.8181, 0.5535, 0.4732, 0.6645, 0.7716, 0.7514, 0.6639, 0.8704, 0.8102, 0.9005, 0.6849, 0.7256, 0.878),
ti = 1:52), 
.Names = c("x", "y", "ti"), class = "data.frame", row.names = 110:161)

ddf<- data.frame(dy = diff(df1$y), dx = diff(df1$x))
ddf2<- data.frame(ddy = diff(ddf$dy), ddx = diff(ddf$dx))
ddf$ti<-1:length(ddf$dx); ddf2$year<-1:length(ddf2$ddx)
summary(lm0<-lm(y~x, data=df1))      #t = 15.0
summary(lm1<-lm(dy~dx, data=ddf))    #t = 2.6
summary(lm2<-lm(ddy~ddx, data=ddf2)) #t = 2.6

回答:


6

マット、あなたは不必要な差分構造の使用に関してあなたが提起した懸念に非常に正しいです。次のACFでここに画像の説明を入力してくださいガウス誤差プロセスをレンダリングしながら、重要な構造を生成するデータに適切なモデルを特定するためここに画像の説明を入力してくださいここに画像の説明を入力してください伝達関数同定モデル化プロセスでは、(この場合は)定常であり、リレーションショップを同定するために使用できる代理系列を作成するために適切な差分が必要です。この場合、IDENTIFICATIONの差分要件は、Xの二重差分とYの単一差分でした。さらに、二重差分XのARIMAフィルターはAR(1)であることがわかりました。このARIMAフィルター(識別目的のみ!)を両方の定常系列に適用すると、次の相互相関構造が得られます。ここに画像の説明を入力してください単純な同時代の関係を示唆しています。ここに画像の説明を入力してください。元のシリーズは非定常性を示しますが、これは必ずしも因果モデルで差分が必要であることを意味するわけではないことに注意してください。最終的なモデルここに画像の説明を入力してくださいと最終的なacfはこれをサポートしますここに画像の説明を入力してください。経験的に特定されたレベルシフト(実際には変化をインターセプトする)を除いて、最終的な方程式は次のようになります。

 Y(t)=-4.78 + .192*X(t) - .177*X(t-1) which is NEARLY equal to 

 Y(t)=-4.78 + .192*[X(t)-X(t-1)] which means that changes in X effect the level of Y

最後に、提案されたモデルの特性に注意してください。ここに画像の説明を入力してください

レベルシフトシリーズ(0,0,0,0,0,0,0,0,0,1,1、.........、1)は、モデルの残差が未処理のままである場合、最初の10の残差と最後の42の間の一般的な残差平均の仮説の検定は、「t検定-4.10」に基づいて、期間10 THUSまたはその前後のシフトは、alpha = .0002で有意になります。定数を含めることにより、残差の全体的な平均がゼロと大幅に異ならないことが保証されますが、これは必ずしもすべてのサブセット時間間隔に当てはまるわけではありません。次のグラフは、これをはっきりと示しています(あなたが見るように言われたことを前提としています!)。実際/適合/予測は非常にわかりやすいですここに画像の説明を入力してください。統計は街灯のようなもので、他のものを照明に使用する人に頼るためにそれらを使用する人もいます。


包括的な分析のデーブをありがとう。ちょうど私が理解していることを確認するために、2はそのままのx変数、3はラグ-1のx変数、4はレベルシフトですか?有馬の仕様はありませんか?
Matt Albrecht、

@MattAlbrecht Yは従属です(値が.0192、-。0748のy); X1は、値が315.97のxです。X2はダミー変数0,0,0,0,0,0,0,0,0,1,1,1,1、... 1です。X1変数には、ボットに係数[.192と-.177]による同時効果と遅延効果があります。最終的な完全な方程式は次の
とおり

@MattAlbrecht Yは従属です(値が.0192、-。0748のy); X1は、値が315.97のxです。X2はダミー変数0,0,0,0,0,0,0,0,0,1,1,1,1、... 1です。X1変数は、係数[.192と-.177]による同時効果と遅延効果の両方を備えています。最後の完全な方程式には4つの係数があります。定数; xとaの2つの係数
IrishStat

1

私もそのアドバイスを理解していません。差分は多項式トレンドを取り除きます。傾向のためにシリーズが類似している場合、差異は基本的にその関係を削除します。トレンド除去されたコンポーネントが関連していると予想される場合にのみ、それを行います。同じ次数の差異が、両方の系列が同じまたは類似した多項式傾向を示している可能性があるホワイトノイズを含む定常ARMAモデルからのように見える残差のacfsにつながる場合。


トレンドがない場合、非定常性を改善するために差分を使用することもできます。あなたが正しく指摘しているように、不当な使用は統計的/計量経済的なナンセンスを作成する可能性があります。
IrishStat、2012年

1

私が理解しているように、差別化は相互相関関数でより明確な答えを与えます。比較ccf(df1$x,df1$y)ccf(ddf$dx,ddf$dy)


相互相関は、差異のある系列間にどのような関係が存在するかを示すことに同意しますが、私のポイントは、これらの系列は主に差異が排除する傾向のために関連しているように見えることです。
マイケルR.チェニック

そこであなた自身の質問に答えませんか?共通の傾向がありますが、私たちはそれに同意します。差別化することで、傾向を見逃すことができます:傾向の変動はどうですか?この場合、xとyの間の相関はラグ0と8で発生します。ラグ8での影響は、ddf $ dyの自己相関でも見ることができます。あなたはそれを差別化せずにそれを知らないでしょう。
キース
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.