iid(均一または正規)データの固有値の推定分布


9

各次元がiid(または、各次元)であり、独立しているように、次元(たとえば、)のデータセットがあると仮定しお互い。dd=20XiU[0;1]XiN[0;1]

次に、このデータセットからランダムオブジェクトを描画し、最近傍点を取り、このセットでPCAを計算します。予想されるのとは対照的に、固有値はすべて同じではありません。20次元のユニフォームでは、一般的な結果は次のようになります。k=3d

0.11952316626613427, 0.1151758808663646, 0.11170020254046743, 0.1019390988585198,
0.0924502502204256, 0.08716272453538032, 0.0782945015348525, 0.06965903935713605, 
0.06346159593226684, 0.054527131148532824, 0.05346303562884964, 0.04348400728546128, 
0.042304834600062985, 0.03229641081461124, 0.031532033468325706, 0.0266801529298156, 
0.020332085835946957, 0.01825531821510237, 0.01483790669963606, 0.0068195084468626625

正規分散データの場合、結果を少なくとも合計に再スケーリングすると、結果は非常に似ているように見えます(分布は、そもそも明らかに分散が大きくなります)。1N[0;1]d

この動作を予測する結果はあるのでしょうか?一連の固有値がいくらか規則的であるかどうか、および期待どおりの固有値がいくつあるか、および期待値と大幅に異なるものがあるかどうかのテストを探しています。

与えられた(小さい)サンプルサイズ、2つの変数の相関係数が有意である場合、結果はありますか?iid変数でさえ、が低い場合に0以外の結果になることがあります。kk


1
うーん、より少ないsigイチジクでそれらの結果を印刷できますか?簡単には解析できません...
shabbychef

ご覧のとおり、マグニチュードは興味深いものです。単純に、それらはすべて同じ大きさであると期待します。
QUITあり-Anony-Mousse 2012

回答:


7

ランダム行列の固有値の分布に関する大規模な文献があります(ランダム行列理論をグーグルで試すことができます)。特に、Marcenko-Pastur分布は、変数と観測の数が無限大になると、平均がゼロで分散が等しいデータの共分散行列の固有値の分布を予測します。密接に関連しているのは、ウィグナーの半円分布です。i.i.d.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.