因子分析における最高の因子抽出方法


29

SPSSは、因子抽出のいくつかの方法を提供します。

  1. 主成分(これは因子分析ではありません)
  2. 重みなし最小二乗
  3. 一般化最小二乗
  4. 最尤法
  5. 主軸
  6. アルファ因数分解
  7. 画像ファクタリング

因子分析(ただし主成分分析、PCA)ではない最初の方法を無視すると、これらの方法のうちどれが「最良」ですか?さまざまな方法の相対的な利点は何ですか?そして基本的に、使用するものをどのように選択しますか?

追加の質問:6つの方法すべてから同様の結果を取得する必要がありますか?


うーん、私の最初の衝動:これに関するウィキペディアのエントリはありませんか?ない場合は-確かに1 ...そこに存在している必要があります
ゴットフリート・ヘルムズ

4
はい、ウィキペディアの記事があります。データが正常な場合はMLEを使用し、それ以外の場合はPAFを使用するように指示します。他のオプションのメリットやその他についてはあまり言及していません。いずれにせよ、実際の経験に基づいて、このサイトのメンバーがこの問題についてどう思うかを知りたいです。
プラキディア

回答:


41

短くするために。最後の2つの方法はそれぞれ非常に特殊であり、番号2〜5とは異なります。それらはすべて共通因子分析と呼ばれ、実際には代替手段と見なされています。ほとんどの場合、それらはかなり類似した結果をもたらします。これらは、共通因子 +固有因子モデルである古典的因子モデルを表すため、「共通」です。通常、アンケートの分析/検証で使用されるのはこのモデルです。

Principal Axis(PAF)、別名反復を持つPrincipal Factorは、最も古く、おそらく非常に人気のある方法です。これは、1sまたは分散の代わりにコミュニティが対角線上にあるマトリックスへの反復PCA 1アプリケーションです。したがって、次の各反復では、収束するまでコミュニティをさらに洗練します。そうすることで、ペアワイズ相関ではなく分散を説明しようとする方法が最終的に相関を説明します。主軸法には、PCAと同様に、相関だけでなく、共分散やその他の分析もできるという利点があります。1SSCPメジャー(生のsscp、余弦)。残りの3つの方法は、相関のみを処理します[SPSSで。共分散は他のいくつかの実装で分析できます]。この方法は、コミュニティの初期推定の品質に依存します(そしてそれは不利です)。通常、2乗の多重相関/共分散が開始値として使用されますが、他の推定値(以前の研究で得られたものを含む)を好む場合があります。詳細はこちらをお読みください。あなたはコメントやPCAの計算と比較して、主軸ファクタリング計算の例を参照したい場合は、で見てくださいここに

2

34

最尤法(ML)データ(相関)は多変量正規分布をもつ母集団からのものであると仮定し(他の方法はそのような仮定を行わない)、したがって相関係数の残差は0の周りに正規分布しなければなりません。相関の処理は、一般化最小二乗法と同じ方法で一意性によって重み付けされます。他の方法ではサンプルをそのまま分析しますが、ML法では母集団についてある程度の推論が可能です。多くの適合インデックスと信頼区間は通常一緒に計算されます[残念ながら、ほとんどの場合SPSSではありません。それ]。

私が簡単に説明した方法はすべて、線形で連続的な潜在モデルです。「線形」とは、たとえばランクの相関関係を分析しないことを意味します。「連続」とは、たとえば、バイナリデータを分析しないことを意味します(四分相関に基づくIRTまたはFAの方が適切です)。


1R

2あなたは2

3あなたはR1あなたはあなたは1Rあなたは1

4

ここに画像の説明を入力してください


もっと多くの側面を追加する必要があると思います:事前に指定された数の因子に因子解を当てはめる方法を使用するか、何らかの基準(固有値、スクリーテストなど)によって因子の数がデータから出現するかどうか。私が理解しているように、MLは多くの因子を事前に指定した場合にのみ意味を持ちます。その後、因子解が求められ、カイ二乗検定さえ可能になります。PCAでは、カイ二乗検定を使用せずに、何らかの基準を指定すると、データプロパティごとに要因の数を動的に表示できます。PAFは両方の方法で使用できます。
ゴットフリードヘルムズ

1
@Gottfried、私はあなたがそれを置く方法にむしろ反対します。すべてのFAの方法は、多くの要因を必要とmは知られている:あなたはのためのモデルに適合メートルに指定します。mの決定に役立つ可能性のあるさまざまな基準を使用できますが、これらはすべて因子抽出メソッド自体の一部ではありません。GLSおよびMLメソッドとともに計算されたカイ二乗を除きます。また、PAメソッドでは、真のコミュニティを事前に知っている場合(これはめったにありません)、それらを作成て最高のmに導くことができます。ただし、いずれの場合でも、抽出アルゴリズムではなくそのyouがmを決定します。
ttnphns

さて、何を使うべきでしょうか?どれが最高ですか?
-MrYouMath

1
最高はあなたが一番好きなものです。あなたが選択し、必要であれば、それがあなたに合う理由を説明します。どこでも。
ttnphns

@ttnphns、の原則はありwhen to use whichますか?
キティガール
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.