PCAは時系列データに適用できますか?


21

主成分分析(PCA)は、基本的に断面データに適用できることを理解しています。年を時系列変数として指定し、PCAを正常に実行することにより、PCAを時系列データに効果的に使用できますか?動的PCAはパネルデータに対して機能し、Stataのコーディングは時系列ではなくパネルデータ用に設計されていることがわかりました。時系列データで機能する特定のタイプのPCAはありますか?

更新。詳細に説明させてください。

現在、道路の長さ、鉄道のルートの長さ、発電能力、電話加入者数などの変数を使用して、インドのインフラストラクチャのインデックスを構築しています。PCAを時系列やパネルデータに適用する論文をレビューしましたが、PCAはiidの仮定を前提とする断面データ用に設計されています。パネルおよび断面データはそれを侵害し、PCAはその中の時系列ディメンションを考慮しません。動的PCAがパネルデータにのみ適用されるのを見てきました。時系列に適用される特定のPCAがあるか、時系列変数として定義された年で静的PCAを実行するかどうかを知りたいですか?


2
特異スペクトル解析(SSA)は、時系列ではPCAと呼ばれることがよくあります。en.wikipedia.org/wiki/Singular_spectrum_analysis
Vladislavs Dovgalecs

1
右側のサイドバー(->)で、PCAと時系列の両方を参照している投稿の一部を確認してください。質問に答える場合は、こちらのコメント欄にリンクしてください。回答がない場合は、問題が特定の方法と異なる点を説明してください。
Glen_b -Reinstateモニカ

それらのいずれも、時系列に関するpcaの質問に答えません。トピックに関する特定のクエリは、科学に関連するか、未回答のままです。
ニシャサイモン

5
PCAは、データ変換、次元削減、探索、および視覚化ツールとして、仮定を行いません。時系列データを含むあらゆるデータで実行できます。実際、PCAは時系列データに非常によく適用されます(「機能PCA」と呼ばれることもありますが、そうでないこともあります)。「動的PCA」と「静的PCA」の意味すらわかりません。心配しないで、標準のPCAを使用してください。
アメーバは、モニカを復活させる

時系列用に特に設計されたFunctional PCAの使用を検討できます。RのFDAパッケージはfPCAを実装しました。多変量fPCAを見つけることができます。
アン

回答:


8

1つのアプローチは、12個の変数の最初の違いを取得して定常性を確保することです。次に、共分散行列を計算し、PCAを実行します。これは、全期間にわたる何らかの平均PCAであり、異なるタイムラグが互いにどのように影響するかについては何も言いません。しかし、それは良い出発点かもしれません。12×12

あなたも時間領域を分解することに興味があるなら、私はコメントで示唆されたようにSSAをチェックアウトします。

系列が静止していると仮定すると、単一の共分散行列が意味を持ちます。データが1以上のオーダーで統合されている場合、おそらくそうであるように、単一の共分散行列の推定では一貫した結果が得られません。ランダムウォークは、たとえば次数1の積分です。2つのランダムウォークの推定共分散は、それらの共同運動については何も言いません。ここでは、共積分分析が必要です。

コメントで示唆されているように、PCA自体は定常性を気にしないので、PCAに任意の正の半正定行列を与えることができ、PCAの意味ではPC分解は問題ありません。

ただし、推定された共分散行列がデータに関して意味のあるものを表していない場合、PCAはもちろんどちらでもありません。


1
+1。「初めての違い」とはどういう意味ですか?
アメーバは、モニカーを復活

最初の違いを意味するので、12個のxのそれぞれに対して、x_t-x_t-1を実行します。
ダッハウ

そのため、時系列そのものではなく、各時系列の時間微分に対してPCAを実行することをお勧めします。それは面白い; なぜこれが最初の提案になるのでしょうか?
アメーバは、Reinstate Monica

2つの理由:1)共分散推定の一貫性を保つために、通常の断面の仮定では、2つの確率変数が独立しており、均等に分布しています(iid)。これにより、サンプル平均の期待値への収束、いわゆる大数の法則(LLN)が保証されます。時系列分析では、2つの確率的プロセスがiidであるという仮定は制限的です。そのため、(多くの異なる種類の)定常性の概念に置き換えられます。LLNが保持し、共分散推定が一貫するようにするには、2つの系列が一緒に定常分布する必要があります。
ダッフー

各確率的プロセスが静止状態である場合(私はほとんど正に確信しています)、それらが共同で静止しているため、共分散推定が意味をなします。最初の違いは、時系列を「より定常」にするための計量経済学の標準的な手法です。そして、ここから推定とPCAは簡単です。要するに、それは簡単だからです:-) ....わかりました2番目の理由はありません
でした..-Duffau

1

はい、時系列のPCAは、金融工学(定量的金融)および神経学で常に実行されます。

Xt×ptprt=log(Pt)log(Pt1)=log(Pt/Pt1)p×pXt×t一般的な考え方は日が冗長になる可能性があるためです-そして、ニューラルネットワークなどにデータを供給するとき、あなたはしたくないニューラルネットは相関の学習に時間を浪費するため、データ行を冗長にするか、フィーチャを相関させる必要があります(直交させたい)。ただし、このアプローチは自己相関に焦点を合わせていません。

γ=t/nXλ+Y=FnβX^=YY^Y=f1β

神経学では、脳波から得られた異なる波長帯域の活動電位の時系列でPCAが実行されます。活動電位を直交(非相関)PCスコアベクトルに変換し、PCを他の分析に入力することが、行動遺伝学の複雑な形質の統計的遺伝モデリングで統計力を高める主な手段です(双極性、新規性などの表現型のため、求める、統合失調症、統合失調症はしばしば重複する)。オーストラリアの大規模な遺伝的双生児研究は、行動遺伝学におけるこれらの重複する特性を解析するのに役立ちました。彼らは彼らの同一の遺伝学の代わりに古かった。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.