各次元がiid(または、各次元)であり、独立しているように、次元(たとえば、)のデータセットがあると仮定しお互い。
次に、このデータセットからランダムオブジェクトを描画し、最近傍点を取り、このセットでPCAを計算します。予想されるのとは対照的に、固有値はすべて同じではありません。20次元のユニフォームでは、一般的な結果は次のようになります。
0.11952316626613427, 0.1151758808663646, 0.11170020254046743, 0.1019390988585198,
0.0924502502204256, 0.08716272453538032, 0.0782945015348525, 0.06965903935713605,
0.06346159593226684, 0.054527131148532824, 0.05346303562884964, 0.04348400728546128,
0.042304834600062985, 0.03229641081461124, 0.031532033468325706, 0.0266801529298156,
0.020332085835946957, 0.01825531821510237, 0.01483790669963606, 0.0068195084468626625
正規分散データの場合、結果を少なくとも合計に再スケーリングすると、結果は非常に似ているように見えます(分布は、そもそも明らかに分散が大きくなります)。
この動作を予測する結果はあるのでしょうか?一連の固有値がいくらか規則的であるかどうか、および期待どおりの固有値がいくつあるか、および期待値と大幅に異なるものがあるかどうかのテストを探しています。
与えられた(小さい)サンプルサイズ、2つの変数の相関係数が有意である場合、結果はありますか?iid変数でさえ、が低い場合に0以外の結果になることがあります。
1
うーん、より少ないsigイチジクでそれらの結果を印刷できますか?簡単には解析できません...
—
shabbychef
ご覧のとおり、マグニチュードは興味深いものです。単純に、それらはすべて同じ大きさであると期待します。
—
QUITあり-Anony-Mousse 2012