主成分分析では、最初の主成分は、分散が最大の 直交方向です。言い換えると、第1主成分は最大分散の方向になるように選択され、第2主成分は最大分散を持つ第1主成分に直交する方向になるように選択されます。
因子分析にも同様の解釈がありますか?たとえば、最初の要因は、元の相関行列の非対角成分を最もよく説明する要因であると考えています(たとえば、元の相関行列と、要因)。これは本当ですか(または、私たちが言える類似の何かがありますか)?
主成分分析では、最初の主成分は、分散が最大の 直交方向です。言い換えると、第1主成分は最大分散の方向になるように選択され、第2主成分は最大分散を持つ第1主成分に直交する方向になるように選択されます。
因子分析にも同様の解釈がありますか?たとえば、最初の要因は、元の相関行列の非対角成分を最もよく説明する要因であると考えています(たとえば、元の相関行列と、要因)。これは本当ですか(または、私たちが言える類似の何かがありますか)?
回答:
PCAは主に、データの低次元空間への投影を取得することを目的としたデータ削減手法です。2つの同等の目的は、分散を繰り返し最大化するか、再構成エラーを最小化することです。これは実際にこの前の質問への答えのいくつかの詳細で解決されます。
対照的に、因子分析は主に生成モデルである次元データベクトルXという X = A S + ε ここで、Sは、あるQ潜在因子の次元のベクトル、AはれるP × KとK < P及びεはあります無相関エラーのベクトル。Aの行列は行列である因子負荷。これにより、共分散行列の特別なパラメーター化がΣ = A A T + Dとして得られます。
したがって、質問に答えるために、選択された因子は因子分析モデルの使用から自動的に与えられないため、最初の因子の単一の解釈はありません。A(の列スペース)の推定に使用する方法と回転の選択に使用する方法を指定する必要があります。もしD = σ 2 I(すべてのエラーが同じ分散を有する)の列空間のMLE溶液Aを導くことによって張られる空間であり、qは、特異値分解により求めることができる主成分ベクトル、。もちろん、これらの主成分ベクトルを回転させずに因子として報告することもできます。
@RAEGTIN、あなたは正しいと思うと信じています。抽出と前の回転の後、連続する各コンポーネントは分散の少ないと少ないのと同じように、共分散/相関の少ないと少ないを説明します:両方の場合、負荷行列Aの列は次の落下の順になりますそれらの2乗要素(負荷)の合計。読み込みは相関bw因子と変数です。したがって、1番目の要因はR行列の「全体」平方rの最大部分を説明し、2番目の要因はここでは2番目などと説明できます。ただし、負荷による相関の予測におけるFAとPCAの違いは次のとおりです。Rを復元するために「調整」されるm個の抽出された因子(m個の因子<p変数)のみで非常に細かく、PCAはm個のコンポーネントでそれを復元するのに失礼ですが、Rをエラーなしで復元するにはすべてのpコンポーネントが必要です。
PS追加するだけです。FAでは、負荷値はクリーンなコミュニティ(相関の原因となる分散の一部)で「構成」されますが、PCAでは負荷はコミュニティと変数の一意性の混合であるため、変動性を取り込みます。