与えられた固有値の分布は既知です


8

ランダムマトリックス理論の洞察を使用して、因子を形成するために使用する共分散/相関行列のPCAから主成分の数を決定することに慣れています。

最初のPCに関連付けられている固有値が大きい場合、それは残りの固有値が小さいことを意味します(固有値の合計は相関行列のトレースと等しくなければならないため)。最初のPCが十分に大きい場合、これらの固有値はすべてMarcenko-Pastur分布の下限を下回る可能性があります。これは、偶然のためではなく、最初の固有値が非常に大きいために低いことを意味します。ただし、重要な情報が含まれているという意味ではありません。むしろ、「最初のPCがいくらか大きいとすると、残りの固有値の分布は、ランダムデータが原因である場合、どのように見えるでしょうか?」という質問をするのが理にかなっています。

この問題に対処する研究はありますか?1つまたは複数の固有値を知ることを条件としてマルセンコパストル分布を得ることが可能である場合、因子を有意な情報に反映するかどうかを決定するために反復的に進めることが可能です。


1要素のランダムデータ(ランダムな回転楕円体)だけについて話していますか?
ttnphns 2013

ランダムな回転楕円体の意味がわかりませんが、通常、テストする要素は複数ある可能性があります。私は条件付きの固有値問題は次のように書くことができるようにそれを働いていた、固有ベクトルが関連付けられている最大の固有値ですが、2つの行列の積の固有値を束縛する不等式として私が見つけることができるものは、かなり広いように見えました。eig(Σ(Iββ)(Iββ))βn
ジョン

少し考えてみると、正しい結果が得られたと思います。λ~±=(1+1Q±21Q)(i=1nλij=1Jλj)/n
John

回答:


3

これはあなたの問題に関する文書です:http : //math.nyu.edu/faculty/avellane/LalouxPCA.pdf

考え方は簡単です。行列の要素の分散を変更して、Marcenko-Pastur分布を計算します。修正された分散は、最初の固有値以外の固有値によって説明される分散に対応します。

ジョンが言ったように、を置き換える必要があります最初の固有値の。問題を正規化し、最初のコンポーネントのみを削除する場合は、を置き換える必要があります。以下を取得します:σ2(i=1nλij=1Jλj)/nJσ21λ1n

ρ(λ)=nQ2π(1λ1)((λmaxλ)(λλmin)λ)

と:

λmin/max=n(1λ1)(1+1Q±21Q)

行列にはおそらく1つの大きな固有値とノイズよりも多くの情報があるため、いくつかの違いが見られます。市場相関研究の例として、スペクトルの上端による固有値の漏れを観察できます。(金融セクターに対応)。

このドキュメントで言及されている別のアプローチは、をマルセンコパスツール分布の単一のパラメータと見なすことです。次に、このパラメーターを調整して曲線に合わせる必要があります。σ2

有用なテクニックとリファレンスの詳細については、以下をご覧ください。http//arxiv.org/abs/physics/0507111


この式はまた、列の数が1だけ減少しているようにQを修正する必要がある
のRohitアローラ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.