観測値と個の変数(次元)を含むデータセットがあり、通常は小さい()、は小さい()からおそらくはるかに大きい()。p n n = 12 − 16 p p = 4 − 10 p = 30 − 50
主成分分析(PCA)または因子分析(FA)を実行するには、がよりもはるかに大きい必要があることを覚えていますが、これは私のデータではそうではないようです。私の目的では、PC2を過ぎた主要コンポーネントにはほとんど興味がないことに注意してください。p
質問:
- PCAを使用しても問題ない場合とそうでない場合の最小サンプルサイズの経験則は何ですか?
- またはあっても最初の数台のPCを使用しても大丈夫ですか?n < p
- これに関する参照はありますか?
あなたの主な目標がPC1とおそらくPC2を使用することであるかどうかは重要ですか?
- 単にグラフィカルに、または
- 次に、合成変数として回帰で使用されますか?