この質問は主にPCA / FAの定義に関するものであるため、意見が異なる場合があります。私の意見では、PCA + varimaxはPCAまたはFAと呼ばれるべきではなく、例えば「varimax-rotated PCA」と明示的に呼ばれます。
これは非常に紛らわしいトピックであることを付け加えておきます。この答えでは、私は回転が実際に何を説明したいです。これには数学が必要です。カジュアルな読者は、図に直接スキップできます。そうして初めて、PCA + rotationを「PCA」と呼ぶべきかどうかを議論できます。
参照の1つは、Jolliffeの著書「主成分分析」のセクション11.1「主成分の回転」ですが、より明確になる可能性があります。
ましょもN × Pの私たちが中心に想定したデータ行列。PCA量(ここでは私の答えを参照)特異値分解に:X = U S V ⊤。この分解には、2つの同等で補完的なビューがあります。PCAスタイルの「投影」ビューとFAスタイルの「潜在変数」ビューです。Xn×pX=USV⊤
PCAスタイルのビューによると、直交方向束(これらは共分散行列の固有ベクトルであり、「主方向」または「軸」とも呼ばれます)、および「主成分」U S(主成分とも呼ばれます)スコア」)は、これらの方向に関するデータの投影です。:主成分は、我々は、書くことができるなど、最初のものは、最大の可能な分散を有し、無相関であるX = U S ⋅ V ⊤ = スコア⋅ 主方向。VUS
X=US⋅V⊤=Scores⋅Principal directions.
FAスタイルの見解によれば、「負荷」を介して観測された変数を生じさせる、いくつかの相関のない単位分散「潜在因子」が見つかりました。確かに、は標準化された主成分(無相関および単位分散あり)であり、負荷をL=VS/ √U˜=n−1−−−−−√U場合、 X= √L=VS/n−1−−−−−√(つまり、注 S ⊤=のS。)両方のビューは等価です。負荷はそれぞれの固有値(S/ √でスケーリングされた固有ベクトルであることに注意してください
X=n−1−−−−−√U⋅(VS/n−1−−−−−√)⊤=U˜⋅L⊤=Standardized scores⋅Loadings.
S⊤=Sは共分散行列の固有値です)。
S/n−1−−−−−√
≠
k<p
X≈UkSkV⊤k=U˜kL⊤k.
k×kTTT⊤=IX≈UkSkV⊤k=UkTT⊤SkV⊤k=U˜rotL⊤rot,
Lrot=LkTU˜rot=U˜kTTLrot その解釈を容易にするために、できるだけまばらに近くなりました。)
回転されるのは、(1)標準化されたスコア、(2)負荷であることに注意してください。しかし、生のスコアでも主要な方向でもありません!したがって、回転は、元の空間ではなく、潜在的な空間で発生します。これは絶対に重要です。
LrotkRpkX
Σ≈LkL⊤k=LrotL⊤rot.
しかし、PCAスタイルの視点は事実上崩壊しています。回転荷重は、直交方向/軸に対応しなくなりました。つまり、列は直交しません!さらに悪いことに、回転した荷重によって与えられた方向にデータを[直交]投影すると、相関(!)投影が得られ、スコアを回復できなくなります。[代わりに、回転後に標準化されたスコアを計算するには、データ行列に負荷の擬似逆数を掛ける必要があります。または、回転マトリックスを使用して、元の標準化されたスコアを単純に回転させることもできます。RpLrotU˜rot=X(L+rot)⊤U˜rot=U˜T ]また、回転されたコンポーネントは最大分散量を連続的にキャプチャしません。ただし、すべての回転成分は、すべての元の主成分とまったく同じくらいの分散をキャプチャします。kk
これがイラストです。データは、主対角線に沿って引き伸ばされた2D楕円です。最初の主方向は主対角線であり、2番目の主方向はそれに直交します。PCAローディングベクトル(固有値でスケーリングされた固有ベクトル)は赤で表示されます-両方の方向を指しており、可視性のために一定の係数で引き伸ばされています。次に、負荷に直交回転を適用しました。結果のローディングベクトルはマゼンタで表示されます。それらが直交していないことに注意してください(!)。30∘
ここでのFAスタイルの直観は次のとおりです。ポイントが小さな円を埋める「潜在空間」を想像してください(単位分散のある2Dガウスから来る)。これらのポイントの分布は、PCAの負荷(赤)に沿って引き伸ばされ、この図に表示されるデータ楕円になります。ただし、同じポイントの分布を回転させ、回転したPCAの負荷(マゼンタ)に沿って引き伸ばして同じデータ楕円にすることができます。
実際には、[ 参照負荷の直交回転があると回転は、1はPCAのバイプロットを見てする必要があります。が元の変数に対応するベクトル/光線は単に回転します。】
まとめましょう。直交回転(バリマックスなど)の後、「回転主」軸は直交せず、それらの直交投影は意味をなしません。したがって、この軸/投影の視点全体をやめる必要があります。まだPCAと呼ぶのは奇妙です(これは、最大分散などの投影に関するものです)。
FAスタイルの観点からは、単純に(標準化された無相関の)潜在的要因を回転させました。これは有効な操作です。FAには「投影」はありません。代わりに、潜在因子が負荷を介して観測変数を生成します。このロジックは引き続き保持されます。ただし、実際には要因ではない主成分から始めました(PCAはFAと同じではないため)。したがって、FAと呼ぶのも奇妙です。
PCAとFAのどちらを呼び出すべきかを議論する代わりに、使用する手順を厳密に指定することをお勧めします。「PCAに続いてバリマックス回転」。
あとがき。がと間に挿入される、代替の回転手順を考慮することができます。これにより、(標準化されたスコアと負荷の代わりに)生のスコアと固有ベクトルが回転します。このアプローチの最大の問題は、そのような「ローテーション」の後、スコアがもはや無相関にならないことであり、これはPCAにとって非常に致命的です。一つはできるそれを行うが、それは回転が通常理解して適用されている方法ではありません。TT⊤USV⊤