相関行列の固有値の分布の直感/解釈は何ですか?通常、最大3つの固有値が最も重要であるのに対し、ゼロに近い固有値はノイズであると聞きがちです。また、自然に発生する固有値分布がランダム相関行列から計算されたものとどのように異なるかを調査するいくつかの研究論文を見ました(ここでも、ノイズを信号から区別します)。
あなたの洞察について詳しく説明してください。
相関行列の固有値の分布の直感/解釈は何ですか?通常、最大3つの固有値が最も重要であるのに対し、ゼロに近い固有値はノイズであると聞きがちです。また、自然に発生する固有値分布がランダム相関行列から計算されたものとどのように異なるかを調査するいくつかの研究論文を見ました(ここでも、ノイズを信号から区別します)。
あなたの洞察について詳しく説明してください。
回答:
通常、3つの最大固有値が最も重要であるのに対し、ゼロに近い固有値はノイズであると聞きます
あなたはそれをテストすることができます。詳細については、この投稿にリンクされている論文を参照してください。繰り返しになりますが、財務の時系列を扱う場合は、最初にレプトクリティを修正する必要があります(つまり、生のリターンではなく、ガーチ調整された一連のリターンを検討します)。
自然に発生する固有値分布がランダム相関行列から計算されたものとどのように異なるかを調査するいくつかの研究論文を見ました(ここでも、ノイズを信号から区別します)。
Edward:>通常、逆の方法でそれを行います。必要なアプリケーションからの(相関行列の)固有値の多変量分布を確認します。固有値の分布の信頼できる候補を特定したら、それらから生成するのはかなり簡単です。
固有値の多変量分布を特定する方法の最良の手順は、同時に検討する資産の数(つまり、相関行列の次元)によって異なります。(はアセットの数)の場合、巧妙なトリックがあります。のp
編集(Shabbychefによるコメント)
4つのステップの手順:
制限は、一連のポイントの凸包の高速計算が、次元数が10より大きい場合に非常に遅くなることです
固有値は、データスプレッドの主成分の大きさを示します。
(ソース:yaroslavvb.com)
最初のデータセットは共分散行列を使用してガウシアンから生成されました2番目のデータセットは回転された最初のデータセットです
私が過去にこの問題を研究した1つの方法は、相関行列の「固有ポートフォリオ」を構築することです。つまり、相関行列の番目に大きい固有値に関連付けられた固有ベクトルを取り、それを1の総レバレッジにスケーリングします(つまり、ベクトルの絶対合計を1に等しくします)。次に、ポートフォリオで大きな表現を持つ株式間の実際の物理的または財務的な接続を見つけることができるかどうかを確認します。
通常、最初の固有ポートフォリオは、すべての名前でほぼ等しい加重です。つまり、ドルの重みが等しいすべての資産で構成される「市場」ポートフォリオです。2番目の固有ポートフォリオは、どの期間を見渡したかに応じて、いくつかの意味上の意味を持つ場合があります。たとえば、主にエネルギー株や銀行株などです。私の経験では、5番目の固有ポートフォリオからストーリーを作成するのは難しいでしょう。これは、一部の宇宙の選択と考慮される期間に依存します。通常、5番目の固有値は、Marchenko-Pastur分布によって課される制限をはるかに超えないので、これは問題ありません。