時系列でピアソン相関を正しく使用する方法


47

2つの時系列(両方とも滑らか)があるので、相互相関を調べて、それらの相関関係を確認します。

ピアソン相関係数を使用するつもりです。これは適切ですか?

2番目の質問は、2つの時系列を好きなようにサンプリングできることです。つまり、データポイントの数を選択できます。これは、出力される相関係数に影響しますか?これを説明する必要がありますか?

説明のため

option(i)

[1,    4,    7,    10] & [6,    9,    6,    9,    6]

option(ii)

[1,2,3,4,5,6,7,8,9,10] & [6,7,8,9,8,7,6,7,8,9,8,7,6]  

1
時系列の性質は何ですか?彼らはランダムウォークですか?定常?経済シリーズ?
アクサカル

回答:


72

ピアソン相関、系列間の相関を調べるために使用されますが、時系列であるため、相関はさまざまなラグ、つまり相互相関関数で見られます

相互相関はシリーズ内の依存関係の影響を受けるため、多くの場合、シリーズ内の依存関係を最初に削除する必要があります。したがって、系列を平滑化するのではなく、この相関を使用するために、残差間の依存関係(変数に適したモデルが見つかった後に残された大まかな部分)を見ることが実際に(意味があるため)より一般的です。

(おそらく)非定常の平滑化された系列間のピアソン相関が解釈可能かどうかを調べる前に、時系列モデルに関する基本的なリソースから始めることをお勧めします。

特に、ここで現象を調べたいと思うでしょう。[時系列では、これはスプリアス相関と呼ばれることもありますが、ウィキペディアのスプリアス相関に関する記事では、この用語の使用を除外しているように思われる方法で、用語の使用について狭い見方をしています。おそらく、代わりにスプリアス回帰を検索することで、ここで説明されている問題の詳細を見つけることができます。]

[編集-ウィキペディアの風景は変わり続けています。上記のパラ。おそらく今あるものを反映するように修正されるべきです。]

例:議論を見る

  1. http://www.math.ku.dk/~sjo/papers/LisbonPaper.pdf(1925年に発表されたが翌年発行された論文の Yuleの冒頭の引用は、問題を非常によく要約している)

  2. クリストスAgiakloglouとアポストロスTsimpanos、定常ARのためのスプリアス相関(1)プロセス http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.611.5055&rep=rep1&type=pdfを あなたも得ることができること(このショー定常系列間の問題;したがって、事前白色化する傾向)

  3. 上記のYuleの古典的な参考文献(1926)[1]。

ここでの議論だけでなく、ここでの議論も役に立つかもしれません

-

時系列間でピアソン相関を意味のある方法で使用することは難しく、時には驚くほど微妙です。


スプリアス相関を調べましたが、AシリーズがBシリーズの原因であるか、その逆であるかは気にしません。シリーズBが何をしているのか(またはその逆)を見てシリーズAについて何かを学べるかどうかを知りたいだけです。言い換えれば、相関関係がありますか。

ウィキペディアの記事で、スプリアス相関という用語の狭い使用に関する以前のコメントに注意してください。

スプリアス相関についてのポイントは、系列が相関しているように見えることがありますが、相関自体は意味がないことです。2人の人が2つの異なるコインを投げて、これまでの頭の数から尾の数を引いた数をシリーズの価値として考えてみましょう。

HTHH...1,0,1,2,...

明らかに、2つのシリーズ間には何の関係もありません。明らかに、どちらももう一方の最初のことをあなたに伝えることができません!

しかし、コインのペアの間で得られる相関関係の種類を見てください。

ここに画像の説明を入力してください

それらが何であるかを言わず、あなたがそれらのシリーズのペアを単独で取った場合、それらは印象的な相関関係になりますか?

しかし、それらはすべて無意味です。本当に偽りです。3つのペアのどれも、実際には他のどのペアよりも正または負に相互に関連しているわけではありません- 累積ノイズだけです。スプリアスが予測についてだけではなく、全体の概念の中シリーズ依存性を考慮せず、一連の関連を考慮するのは見当違いさ。

すべてのあなたがここに持っているのです内のシリーズの依存。実際のクロスシリーズの関係は何もありません。

これらのシリーズを自動的に依存させる問題に適切に対処すると、それらはすべて統合されるため(ベルヌーイランダムウォーク)、それらを区別する必要があります-「見かけの」関連付けが消えます0.048です)。

それが真実であることがわかります-明らかな関連性は、シリーズ内の依存性によって引き起こされる単なる幻想です。

そこの中シリーズの依存だとあなたがいる場合:ので予めご了承下さい-あなたの質問は、「時系列で正しくピアソン相関を使用する方法」尋ねていない最初にそれに対処する、あなたはそれを正しく使用することはありません。

さらに、平滑化はシリアル依存の問題を軽減しません。まったく逆です-さらに悪化します!平滑化後の相関は次のとおりです(Rで実行されたデフォルトの平滑化-シリーズとインデックスの平滑化):

            coin1      coin2     
coin2   0.9696378 
coin3  -0.8829326 -0.7733559 

それらはすべて0からさらに進んでいます。それらはすべて無意味なノイズすぎませんが、今では平滑化された累積ノイズになっています。(平滑化することにより、相関計算に入れた系列の変動性を低減します。そのため、相関が高くなる可能性があります。)

[1]:ユール、GU(1926)「時系列間でナンセンス相関が発生することがあるのはなぜですか?」J.Roy.Stat.Soc。891、頁1-63


すばらしい回答をありがとう。スプリアス相関を調べましたが、AシリーズがBシリーズの原因であるか、その逆であるかは気にしません。シリーズBが何をしているのか(またはその逆)を見てシリーズAについて何かを学べるかどうかを知りたいだけです。言い換えれば、相関関係がありますか。
user1551817

更新された回答をご覧ください。
-Glen_b

2
「..だからあなたはそれらを変える必要がある..」それは正確に何を意味するのでしょうか?おそらく、それらを区別する..?
ゲオルギオスPligoropoulos

1
差分-ウィキペディアを参照してくださいここか、このセクションブックの予測、原則と実践。その後の質問で、引用する段落の残りの部分は非常に明示的にそう言っています。(しかし、それが唯一の可能性ではなく、行われた合理的に一般的なことを説明しているだけです)
Glen_b

1
私は紙の別のバージョンであるように思わどんな位置し、タイトルや著者を追加した
Glen_b

6

(St)1tTXt=StSt1)(ランダムウォークの場合)独立しており、同一に分布しています。スピアマン相関またはケンドール相関を使用することをお勧めします。これらはピアソン係数よりも堅牢です。ピアソンは線形依存性を測定しますが、スピアマンとケンドール測定は変数の単調な変換によって不変です。

また、2つの時系列が強く依存していると想像してください。たとえば、一緒に上昇し、一緒に下降しますが、一方は時々強い変動を受け、もう一方は常に軽度の変動があるため、ピアソン相関はスピアマンおよびケンドールのものとは異なり、かなり低くなります時系列間の依存関係のより良い推定値です)。

これについて徹底的に治療のために、より良い依存性を理解し、あなたが見ることができコピュラ理論、および時系列に適用するため


4

通常、時系列データは時間に依存します。ただし、ピアソン相関は独立したデータに適しています。この問題は、いわゆるスプリアス回帰に似ています。係数は非常に重要である可能性が高いですが、これは両方のシリーズに影響を与えるデータの時間トレンドのみから来ています。データをモデル化し、モデル化によって両方のシリーズで同様の結果が得られるかどうかを確認することをお勧めします。ただし、ピアソン相関係数を使用すると、依存構造の解釈に誤解を招く結果が生じる可能性が最も高くなります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.