2つの時系列を統計的に比較する方法は?


43

次のプロットに示す2つの時系列があります。

時系列プロット

プロットは両方の時系列の完全な詳細を示していますが、必要に応じて、同時観測に簡単に縮小できます。

私の質問は、時系列の違いを評価するためにどのような統計的方法を使用できますか?

これはかなり広範で曖昧な質問であることは知っていますが、これに関する入門的な資料はどこにも見当たらないようです。私が見ることができるように、評価する2つの明確なものがあります:

1.値は同じですか?

2.トレンドは同じですか?

これらの質問を評価するために、どのような統計テストを検討することをお勧めしますか?質問1については、明らかに異なるデータセットの平均を評価し、分布の重要な違いを探すことができますが、データの時系列の性質を考慮してこれを行う方法はありますか?

質問2-2つの傾向の類似性を調べるMann-Kendallテストのようなものはありますか?両方のデータセットに対してMann-Kendallテストを実行して比較することはできますが、それが物事を行うための有効な方法であるかどうか、またはより良い方法があるかどうかはわかりませんか?

私はこれをすべてRで行っているので、あなたが提案するテストがRパッケージを持っているなら、私に知らせてください。


9
プロットは、これらのシリーズの重要な違いを曖昧にしているように見えます。異なる周波数でサンプリングされている可能性があります。黒い線(Aeronet)は約20回しかサンプリングされておらず、赤い線(Visibility)は数百回以上サンプリングされているようです。もう1つの重要な要因は、サンプリングの規則性、またはサンプリングの欠如かもしれません。Aeronetの観測間の時間は少し異なるようです。一般に、接続線を消去し、実際のデータに対応するポイントのみを表示して、視聴者がこれらのことを視覚的に判断できるようにします。
whuber

これは、不等間隔の時系列分析用のPythonライブラリです。
kjetil bハルヴォルセン

回答:


27

他の人が述べたように、測定の共通の頻度(すなわち、観察間の時間)を持っている必要があります。それができたら、各シリーズを個別に合理的に説明する共通モデルを特定します。これは、ARIMAモデルまたはレベルシフトが可能な多重トレンド回帰モデル、またはメモリ(ARIMA)とダミー変数の両方を統合した複合モデルの可能性があります。この共通モデルは、2つのシリーズのそれぞれについてグローバルかつ個別に推定でき、その後、パラメーターの共通セットの仮説をテストするF検定を作成できます。


1
まあ、あなたは本当に両方のシリーズで同じ周波数を持つ必要はありません。それだけで他の場合にはほとんどソフトウェアはありませんが、traces.readthedocs.io/en/latestを参照してください。ずっと...天文学の雑誌で、財務および地球物理学の他の例についてpubslihedで、参考文献を参照してくださいているように思えるen.wikipedia.org/wiki/Unevenly_spaced_time_series
HalvorsenのはKjetil B

12

考えてみましょうgrangertest()lmtestライブラリ。

ある時系列が別の時系列の予測に役立つかどうかを確認するテストです。

始めるためのいくつかの参照:

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/Kgranger.pdf

http://en.wikipedia.org/wiki/Granger_causality


1
彼のサンプルサイズは、データポイントが10未満であるため、グレンジャーに収まる必要があるパラメーターの量に対して小さすぎます。
ジェイス

1
@fionn、あなたの答えのリンクは死んでいます。答えを更新できますか?
デイヴァージョシポビッチ

0

これに出会ったばかりです。最初の答えは、2つのセットを同じスケールで(時間的に)プロットして、違いを視覚的に確認することです。これを実行すると、明らかな違いがあることが簡単にわかります。次のステップは、単純な相関分析を使用することです...そして、それらが相関係数(r)を使用してどの程度関連しているかを確認します。rが小さい場合、それらは弱く関連しているため、望ましい比較は行われず、rが2つのシリーズ間の良好な比較sを示唆する場合は大きな値になるという結論になります。良好な相関がある3番目のステップは、rの統計的有意性をテストすることです。ここでは、2つの系列が正規分布(帰無仮説)または分布しない(代替仮説)と仮定するシャピロウェルチ検定を使用できます。他にもできるテストはありますが、私の答えが役立つことを願っています。


1
時系列を比較するとき、それは自己相関であり、場合によっては時系列モデルに適合します。似ているかどうかを判断するのに役立つARIMAモデルなど。同じ確率過程の2つの実現は、それらをプロットするときに必ずしも同じように見えません。
マイケルチャーニック

-2

polyfitを使用して、両方の時系列信号に直線を近似します。次に、両方のラインの二乗平均平方根誤差(RMSE)を計算します。赤線で得られる値は、灰色線で得られる値よりもかなり小さくなります。

また、いくつかの一般的な周波数で読み取りを行います。


2
Cross Validatedへようこそ。最初の回答に感謝します。しかし、あなたが質問に直接答えていないことを懸念しています-提案されたアプローチは、質問者が値や傾向が類似しているかどうかを評価するのにどのくらい正確に役立ちますか?
マーティンモドラーク
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.