単純なバージョンでは、時間の経過とともに一方向に変化する傾向がある2つの変数は、それらの間に関係があるかどうかに関係なく、相関しているように見えます。以下の変数を考慮してください。
set.seed(1)
time = seq(from=1, to=100, by=1)
x = .5 + .3*time + rnorm(100)
y1 = 3 + .3*time + rnorm(100)
y2 = 7 + .1*time + .8*x + rnorm(100)
はと同様に時間の関数です。 は時間との両方の関数です。ポイントは、と間に実際に関係があり、と間に関係がないことをコードから認識することです。次の図を見てください。3行すべてがひどく似ていますよね。バツy1y2バツバツy2バツy1
実際、と関係の値R2バツy1R2バツy2バツy1バツy2、実際の外観と単なる外観をどのように区別しますか?ここで差異が生じます。変数のうち2つについては、両方とも時間が経つにつれて上昇する傾向があるため、あまり有益ではありません。差分により、その質問に答えることができます。次の2つの図に注意してください。3つの変数すべてを差分した後に作成した散布図です。
バツy2R2= .43バツy1R2= .07R2
いくつかの他のポイント:図では、これらが同時に変更されることを指摘します。それには何の問題もありません。それは私が問題を設定した方法から来ていますが、通常、人々は何らかの遅れで効果に興味を持っています。(つまり、ある時点で1つのことを変更すると、後で別の何かが変更されることになります。)次に、シリーズの1つのログを取ることについて言及します。ログを取得すると、データがレベルからレートに切り替わります。したがって、違いがある場合は、レベルの変化ではなくレートの変化を見ています。それは非常に一般的ですが、デモではその要素を含めませんでした。それは私が議論した問題に直交しています。最後に、時系列データは多くの場合、デモで説明するよりも複雑であることを認識したいと思います。