誰かが時系列データで自己相関関数を説明できますか?データにacfを適用すると、アプリケーションはどうなりますか?
誰かが時系列データで自己相関関数を説明できますか?データにacfを適用すると、アプリケーションはどうなりますか?
回答:
通常のサンプリングデータとは異なり、時系列データは順序付けられます。したがって、有用な時間的パターンがある場合は、サンプルに関する追加情報を利用できます。自己相関関数は、データ内のパターンを見つけるために使用されるツールの1つです。具体的には、自己相関関数は、さまざまなタイムラグで区切られたポイント間の相関を示します。例として、離散期間を含むシリーズの可能なacf関数値を次に示します。
表記は、ACF(n =ポイント間の期間数)= n期間で区切られたポイント間の相関です。nの最初のいくつかの値の例を示します。
ACF(0)= 1(すべてのデータはそれ自体と完全に相関しています)、ACF(1)=。9(ポイントと次のポイント間の相関は0.9です)、ACF(2)=。4(ポイント間の相関2時間先のポイントは0.4)...などです。
そのため、ACFは、それらが分離されているタイムステップの数に基づいて、相関ポイントが互いにどのように相関しているかを示します。それが自己相関の要点であり、異なる時間間隔の値に対して、過去のデータポイントと将来のデータポイントがどのように相関するかです。通常、特定のデータセットから将来を予測することは一般により困難であるため、ポイントがより分離されると(つまり、上記の表記法ではnが大きくなると)自己相関関数は0に下がると予想されます。これはルールではありませんが、典型的なものです。
さて、第二部に...なぜ私たちは気にしますか?ACFとその姉妹機能、部分的自己相関関数(これについては後で詳しく説明します)は、Box-Jenkins / ARIMAモデリングアプローチで使用され、過去と未来のデータポイントが時系列でどのように関連しているかを判断します。部分自己相関関数(PACF)は、いくつかの期間nで区切られた2つのポイント間の相関と考えることができますが、介在する相関の影響は除去されます。これは重要です。実際には、各データポイントはNEXTデータポイントと直接相関しているだけで、他のデータポイントとは相関していないと言えます。ただし、現在のポイントが将来のポイントと相関しているように見えますが、これは「連鎖反応」タイプの効果によるものです。つまり、T1はT3と直接相関しているT2と直接相関しているため、 T1はT3と直接相関しています。PACFは、T2との間にある相関を除去するため、パターンをより適切に識別できます。これのいい紹介はここに。
オンラインのNISTエンジニアリング統計ハンドブックには、これに関する章と、自己相関および部分自己相関を使用した時系列分析の例もあります。ここではそれを再現しませんが、それを調べてみると、自己相関についての理解が深まるはずです。