自己相関関数とは何ですか?


16

誰かが時系列データで自己相関関数を説明できますか?データにacfを適用すると、アプリケーションはどうなりますか?



広義の定常時系列のコンテキストでは、時系列の遅延バージョンへの依存性の尺度を提供します。
カグダスオズゲンク

1
これは、現在の値が時系列の前の値の影響を受けている度合いの尺度です。
htrahdis

@htrahdis標準の回帰設定と同様に、相関影響(または因果関係)を混同しないように注意してください。
whuber

@Andyそのスレッドは確かに似ています-それを見つけてくれてありがとう-受け入れられた(そして唯一の)答えはこの質問に直接対処しません:それは特定のacfに焦点を当てています。そのため、acfの解釈方法の説明を提供しますが、その資料のいずれかがACF全般の説明に対する現在の要求に応答するかどうかはわかりません。
whuber

回答:


31

通常のサンプリングデータとは異なり、時系列データは順序付けられます。したがって、有用な時間的パターンがある場合は、サンプルに関する追加情報を利用できます。自己相関関数は、データ内のパターンを見つけるために使用されるツールの1つです。具体的には、自己相関関数は、さまざまなタイムラグで区切られたポイント間の相関を示します。例として、離散期間を含むシリーズの可能なacf関数値を次に示します。

表記は、ACF(n =ポイント間の期間数)= n期間で区切られたポイント間の相関です。nの最初のいくつかの値の例を示します。

ACF(0)= 1(すべてのデータはそれ自体と完全に相関しています)、ACF(1)=。9(ポイントと次のポイント間の相関は0.9です)、ACF(2)=。4(ポイント間の相関2時間先のポイントは0.4)...などです。

そのため、ACFは、それらが分離されているタイムステップの数に基づいて、相関ポイントが互いにどのように相関しているかを示します。それが自己相関の要点であり、異なる時間間隔の値に対して、過去のデータポイントと将来のデータポイントがどのように相関するかです。通常、特定のデータセットから将来を予測することは一般により困難であるため、ポイントがより分離されると(つまり、上記の表記法ではnが大きくなると)自己相関関数は0に下がると予想されます。これはルールではありませんが、典型的なものです。

さて、第二部に...なぜ私たちは気にしますか?ACFとその姉妹機能、部分的自己相関関数(これについては後で詳しく説明します)は、Box-Jenkins / ARIMAモデリングアプローチで使用され、過去と未来のデータポイントが時系列でどのように関連しているかを判断します。部分自己相関関数(PACF)は、いくつかの期間nで区切られた2つのポイント間の相関と考えることができますが、介在する相関の影響は除去されます。これは重要です。実際には、各データポイントはNEXTデータポイントと直接相関しているだけで、他のデータポイントとは相関していないと言えます。ただし、現在のポイントが将来のポイントと相関しているように見えますが、これは「連鎖反応」タイプの効果によるものです。つまり、T1はT3と直接相関しているT2と直接相関しているため、 T1はT3と直接相関しています。PACFは、T2との間にある相関を除去するため、パターンをより適切に識別できます。これのいい紹介はここに。

オンラインのNISTエンジニアリング統計ハンドブックには、これに関する章と、自己相関および部分自己相関を使用した時系列分析の例もあります。ここではそれを再現しませんが、それを調べてみると、自己相関についての理解が深まるはずです。


2

別の見方をします。

時系列の時間差の値を時系列の現在の値でプロットします。

表示されるグラフが線形の場合、時系列の現在の値と時系列の時間差の値との間に線形依存関係があることを意味します。

自己相関値は、その依存関係の線形性を測定する最も明白な方法です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.