直感/相関行列の固有値の分布の解釈?


13

相関行列の固有値の分布の直感/解釈は何ですか?通常、最大3つの固有値が最も重要であるのに対し、ゼロに近い固有値はノイズであると聞きがちです。また、自然に発生する固有値分布がランダム相関行列から計算されたものとどのように異なるかを調査するいくつかの研究論文を見ました(ここでも、ノイズを信号から区別します)。

あなたの洞察について詳しく説明してください。


特定のアプリケーションを念頭に置いていますか?つまり、アプリケーションとは別に(純粋な数学的側面で)考慮する必要があるEVの数に関する一般的なアドバイスを求めたり、特定のコンテキスト(たとえば、因子分析、 PCAなど)?
2010

数学の側面、つまり相関行列の基礎となるデータのプロパティとしての固有値にもっと興味があります。特定のコンテキストの観点からこれを議論することが理にかなっている場合は、遠慮なくそうしてください。
Eduardas

回答:


4

通常、3つの最大固有値が最も重要であるのに対し、ゼロに近い固有値はノイズであると聞きます

あなたはそれをテストすることができます。詳細については、この投稿にリンクされている論文を参照してください。繰り返しになりますが、財務の時系列を扱う場合は、最初にレプトクリティを修正する必要があります(つまり、生のリターンではなく、ガーチ調整された一連のリターンを検討します)。

自然に発生する固有値分布がランダム相関行列から計算されたものとどのように異なるかを調査するいくつかの研究論文を見ました(ここでも、ノイズを信号から区別します)。

Edward:>通常、逆の方法でそれを行います。必要なアプリケーションからの(相関行列の)固有値の多変量分布を確認します。固有値の分布の信頼できる候補を特定したら、それらから生成するのはかなり簡単です。

固有値の多変量分布を特定する方法の最良の手順は、同時に検討する資産の数(つまり、相関行列の次元)によって異なります。(はアセットの数)の場合、巧妙なトリックがあります。のpp10p

編集(Shabbychefによるコメント)

4つのステップの手順:

  1. あなたが持っていると仮定し多変量データのサブサンプルを。各サブサンプル分散共分散行列推定器が必要です(古典的な推定器または高速MCDなどの堅牢な代替手段を使用できます。これは、MATLAB、SAS、S、 R、...)。いつものように、財務時系列を扱う場合は、生のリターンではなく、一連のガーチ調整されたリターンを検討する必要があります。C J Jj=1,...,JC~jj
  2. 各サブサンプル用、計算、...、、固有値。jログλ jの1ログλ J PC JΛ~j= log(λ~1j)log(λ~pj)C~j
  3. JV 番目のエントリがである行列の凸包である計算しますこれも、Matlab、R、...で適切に実装されています) 。J × P Λ JCV(Λ~)J×pΛ~j
  4. 内側からランダムにポイントを描画します (これは、各エッジに重みを与えることによって行われここで、、ここでは単位指数分布からの描画です(詳細はこちら)。W I C V ΛW I = γ ICV(Λ~)wiCV(Λ~) γIwi=γii=1pγiγi

制限は、一連のポイントの凸包の高速計算が、次元数が10より大きい場合に非常に遅くなることですJ2


1
私は好奇心が強い:トリックは何ですか?
shabbychef 2010

あなたは意味するか固有ベクトルの 3での?値ではありませんか?C~
shabbychef 2010

番号。はスカラーです。λ1
user603 2010

これは非常に奇妙な手順です。それはどこかで公開されましたか?
shabbychef 2010

@Shabbychev:>いいえ、私は、関連する問題(時系列に関係するだけではない1)しばらく前に(これと同じ問題に仕事をする機会を持っていたstats.stackexchange.com/questions/2572/...
user603

11

固有値は、データスプレッドの主成分の大きさを示します。


(ソース:yaroslavvb.com
最初のデータセットは共分散行列を使用してガウシアンから生成されました2番目のデータセットは回転された最初のデータセットです(3001)π/4


2

私が過去にこの問題を研究した1つの方法は、相関行列の「固有ポートフォリオ」を構築することです。つまり、相関行列の番目に大きい固有値に関連付けられた固有ベクトルを取り、それを1の総レバレッジにスケーリングします(つまり、ベクトルの絶対合計を1に等しくします)。次に、ポートフォリオで大きな表現を持つ株式間の実際の物理的または財務的な接続を見つけることができるかどうかを確認します。k

通常、最初の固有ポートフォリオは、すべての名前でほぼ等しい加重です。つまり、ドルの重みが等しいすべての資産で構成される「市場」ポートフォリオです。2番目の固有ポートフォリオは、どの期間を見渡したかに応じて、いくつかの意味上の意味を持つ場合があります。たとえば、主にエネルギー株や銀行株などです。私の経験では、5番目の固有ポートフォリオからストーリーを作成するのは難しいでしょう。これは、一部の宇宙の選択と考慮される期間に依存します。通常、5番目の固有値は、Marchenko-Pastur分布によって課される制限をはるかに超えないので、これは問題ありません。


1

変数の各値は、次元空間内のポイントを定義します。この点群は、多くの場合楕円体に似ています(そうでない場合は、変数を線形関係であると見なすべきではなく、相関関係はあまり意味がありません)。楕円体の軸は相関行列の固有ベクトルに対応し、それらの「強度」は固有値に対応します。証拠は、主成分分析を扱っている時系列分析のテキストにあります。PCAまたはその他の固有値ベースの方法が重要である理由の大まかな直観は、何らかの「主な」原因を持つプロセスがあり、残りは「ノイズ」であるということです。NN

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.