因子分析/ PCAで回転を行う背後にある直感的な理由と、適切な回転を選択する方法は何ですか?


33

私の質問

  1. 因子分析で因子(またはPCAのコンポーネント)の回転を行う背後にある直感的な理由は何ですか?

    私の理解では、変数が最上位のコンポーネント(または要因)にほぼ均等にロードされる場合、コンポーネントを区別することは明らかに困難です。そのため、この場合、回転を使用してコンポーネントをより適切に区別できます。これは正しいです?

  2. 回転を行うとどうなりますか?これは何に影響しますか?

  3. 適切なローテーションを選択する方法は?直交回転と斜め回転があります。これらの選択方法と、この選択の意味は何ですか?

最小限の数式で直感的に説明してください。広範にわたる答えはほとんどありませんでしたが、私は直感的な理由と経験則でもっと探しています。

回答:


34
  1. 回転の理由。回転は、因子分析で抽出された因子(または、PCAを因子分析手法として使用する場合はPCAのコンポーネント)の解釈のために行われます。あなたの理解を説明するとき、あなたは正しいです。回転は、単純な構造と呼ばれる可能性のある、ローディングマトリックスの構造を追求して行われます。異なる要因が異なる変数をロードする傾向がある場合です11。[変数が「変数を読み込む」よりも「因子が変数を読み込む」と言う方が正しいと思う。ある意味で、典型的な単純な構造は、相関変数の「クラスター」が現れる場所です。次に、ファクターによって十分にロードされる変数の意味の共通部分にある意味として、ファクターを解釈します。したがって、異なる意味を受け取るには、要因が変数に異なる負荷をかける必要があります。経験則では、ファクターは少なくとも3つの変数を適切にロードする必要があります。

  2. 結果。回転は、因子の空間における変数の相対的な位置を変更しません。つまり、変数間の相関は保持されます。変更されるのは、因子ベクトル上の変数ベクトルの終点の座標-負荷(詳細については、「負荷プロット」および「バイプロット」についてこのサイトを検索してください)2。負荷行列の直交回転後、因子の分散は変更されますが、因子は無相関のままで、変数のコミュニティ性は保持されます。2

    斜め回転要因はそれが明確な「シンプルな構造」を生成する場合は、そのuncorrelatednessを失うことが許可されています。ただし、相関する要因の解釈は、それが相関する別の要因の意味を汚染しないように、ある要因から意味を引き出す必要があるため、より難しい技術です。つまり、要因を1つずつではなく並行して解釈する必要があることを意味します。斜め回転では、パターンマトリックスPと構造マトリックスSの1つの代わりに、2つの負荷のマトリックスが残ります。(S=PC、ここでCは因子間の相関行列、C=QQ、ここでQは斜め回転の行列:S=AQ、ここでAは回転前の負荷行列です。)パターン行列は、因子が変数を予測する回帰重みの行列であり、構造行列は相関(または共分散)因子と変数の間。ほとんどの場合、これらの係数は変数への因子の一意の個々の投資を表すため、パターンの負荷によって因子を解釈します。斜めの回転は、可変共通性を保持していないが、共通性はもはやに正方形の列の和に等しいP又はにおけるS。さらに、因子は相関するため、それらの分散は部分的に重なります33

    4

  3. 選択。直交回転と斜め回転には多くの形式があります。どうして?第一に、「単純な構造」の概念は一義的ではなく、多少異なって定式化できるためです。例えば、バリマックス -最も人気のある直交方法は、 -各因子の負荷の二乗値のうち分散を最大化しようとします。時々使用される直交法quartimaxは、変数を説明するのに必要な因子の数を最小化し、いわゆる「一般因子」を生成することがよくあります。第二に、異なる回転は、単純な構造とは別に、異なる側面の目的を目指します。これらの複雑なトピックの詳細については説明しませんが、自分でそれらについて読みたいと思うかもしれません。

    5(それぞれに独自の傾向がありますが)強制的に要素を相関させることはできますが、そのため、制限が緩和されます。斜め回転が因子の相関関係が弱いことを示している場合、「現実」はそうであると確信している可能性があり、その後、良心を持って直交回転に切り替えることができます。一方、因子が非常に相関している場合、それは不自然に見えます(特に心理学などで目録を作成している場合、概念的に異なる潜在的特性については、因子それ自体が単変量特性であり、バッチではないことを思い出してください現象)、より少ない要因を抽出するか、斜めの結果をバッチソースとして使用して、いわゆる2次要因を抽出することができます。


1

ここに画像の説明を入力してください

これは純粋に探索的なFAのためのものです。一方、アンケートを作成するためにFAをやり直している場合、2つの要素しかない場合、最終的には青い点を除くすべての点を削除します。3つ以上の要因がある場合、他の要因の負荷プロットの一部で赤い点を青にする必要があります。


2

ここに画像の説明を入力してください


3SSA1R2C1


4


5(通常)またはそれなし。正規化により、回転時にすべての変数が等しく重要になります。


さらに読むためのいくつかのスレッド:

因子をまったく回転させない理由はありますか?

斜め回転後に解釈するマトリックス-パターンまたは構造?

因子回転手法の名前(varimaxなど)はどういう意味ですか?

コンポーネントが回転したPCAはPCAのままですか、それとも因子分析ですか?


1
+1。この質問を見たので、あなたが答えを提供してくれることを望んでいました。ところで、私はそのような質問がここで以前に聞かれていないことに驚いた(少なくともそのような明確な形では)。
アメーバは、2015

+1。返信いただきありがとうございます!1)因子分析とPCAを別々に理解していますが、「因子分析手法としてのPCA」とはどういう意味ですか?PCAとFAは、2つの別個の目的を満たすために2つの異なるものですか?これは、PCAコンポーネントが複雑な構造を持っている場合、回転を使用して単純化できないことを意味しますか?
GeorgeOfTheRF

2)「Varimaxは各因子の負荷間の分散を最大化しようとします」負荷間の分散を最大化する利点は何ですか?
GeorgeOfTheRF

コメントの(1)について:はい、2つの分析方法は異なります。しかし、人々は時々FAの目的でPCAを使用します。私の答えと関連するスレッド全体をご覧ください。PCAの因子の回転は、FAと同じグラウンドで正確に使用できます。回転に関しては、違いはありません。
ttnphns

コメント(2)。Varimaxは、負荷の絶対値の分散を最大化します。その結果、各因子の因子負荷は(絶対に)大小に明確に「分割」されます。Quartimaxは、各変数が1つのファクターだけでロードされるようにします。
ttnphns
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.