PCA後の斜めローテーションの使用について


9

SAS、SPSS、Rなどのいくつかの統計パッケージでは、PCAの後にある種の因子ローテーションを実行できます。

  1. PCAの後にローテーションが必要なのはなぜですか?
  2. PCAの目的が直交次元を生成することであるとすると、PCAの後に斜め回転を適用するのはなぜですか?

PCAは偏った結果を与えるため、PCA後の因子ローテーションの必要性を示す質問をしました。stats.stackexchange.com/questions/6575/…を
mbaitoff

回答:


8

PCAについてはさまざまな意見や見解があると思いますが、基本的には、PC を適切にセンタリング/標準化することを考慮すれば、基本的には削減手法(機能スペースをより小さなものに削減し、多くの場合「より読みやすい」と見なします)データが必要な場合)または潜在的要因を構築する方法または個人間分散の重要な部分を占める次元(ここで、「個人」とは、データが収集される統計単位を表します。これは、国、人などである場合があります)。どちらの場合も、任意の2つの主成分間の直交性の制約を受けて、分散の最大値(主軸に投影した場合)を説明する元の変数の線形結合を構築します。今、説明されているのは純粋に代数的または数学的なものであり、ある種の測定誤差を説明するための誤差項を含める因子分析の伝統で行われていることとは対照的に、それは(生成)モデルとは見なされません。 。私はまた、Rを使用した応用心理測定学に関する次のハンドブックでウィリアム・レベルによって与えられた紹介が好きです (第6章)、相関行列の構造を分析する場合、

最初の[アプローチ、PCA]は、各コンポーネントが変数の加重線形和であるコンポーネントの積の観点から相関行列を近似するモデルです。2番目のモデル[因子分析]も、相関行列の近似です。 2つの要素の積ですが、この要素は、変数の結果ではなく原因と見なされます。

つまり、PCAでは、各コンポーネント(因子)を変数の線形結合として表現しているのに対し、FAでは、これらは因子の線形結合として表現される変数です。どちらの方法でも、一般に非常に似た結果が得られることはよく知られています(たとえば、Harman、1976、またはCatell、1978を参照)。検討している作者にもよりますが、2から10の間です!)これは、相関行列の対角線を推定することにより(FAで行われるように、これらの要素は共通性として知られています)、誤差分散が因子行列から除去されるためです。これが、前世紀に開発されたFAの代わりにPCAが潜在的な要因や心理的構造を明らかにする方法としてよく使用される理由です。しかし、このようにしていくと、結果の因子構造(またはいわゆるパターンマトリックス)をより簡単に解釈したい場合がよくあります。そして、階乗軸を回転させる便利なトリックが来るので、特定の因子の変数のロードを最大化するか、または同等に「単純な構造」に到達します。直交回転(例:VARIMAX)を使用して、因子の独立性を維持します。斜めの回転(OBLIMIN、PROMAXなど)を使用すると、回転が解除され、要素を相関させることができます。これは文献で大いに議論されており、一部の著者(精神測定学者ではなく、1960年代初頭の統計学者)をリードしています

しかし、要点は、ローテーション手法はもともとFAアプローチのコンテキストで開発され、現在はPCAで日常的に使用されているということです。これは主成分のアルゴリズムによる計算に矛盾しないと思います。(斜めの回転によって)相関がとられると階乗空間の解釈があまり明確にならないことを覚えておくと、階乗軸を好きなように回転させることができます。

PCAは、新しいアンケートを作成するときに日常的に使用されますが、測定エラーを考慮に入れて、その関係を独自に調査する可能性のある有意な要因を抽出しようとしているため(たとえば、結果のパターンを除外することによって)、FAはおそらくこの方がより良いアプローチです。行列では、2次因子モデルが得られます)。ただし、PCAは、既に検証済みの要因の階乗構造をチェックするためにも使用されます。研究者は、FAとPCAの違いについてはそれほど重要ではありません。たとえば、5つの次元に取り組む60項目のアンケートを評価するように求められた500人の代表的な被験者(これはNEO-FFIの場合です)たとえば)、そして私は生成モデルまたは概念モデルを特定することにあまり興味がないので、それらは正しいと思います(ここでは、「代表」という用語は、測定の不変性の問題を軽減するために使用されています)。

ここで、回転方法の選択と、一部の著者が直交回転の厳密な使用に反対する理由について、次の質問FA:「単純な構造に基づく回転行列の選択」に答えたように、Paul Klineを引用したいと思います。基準」

(...)現実の世界では、行動の重要な決定要因としての要因が相関していると考えることは不合理ではありません。-P.クライン、 インテリジェンス。心理測定ビュー、1991、p。19

したがって、私は、あなたの研究の目的に応じて、結論を出します(相関行列の主なパターンを強調表示しますまたは、そのような相関行列を観察する原因となる可能性のある根本的なメカニズムの賢明な解釈を提供しようとします? )、最も適切な方法を選択する必要があります。これは、線形結合の構築とは関係なく、結果として得られる階乗空間を解釈する方法にのみ関係します。

参考文献

  1. ハーマン、HH(1976)。現代因子分析。シカゴ、シカゴ大学出版局。
  2. Cattell、RB(1978)。因子分析の科学的使用。ニューヨーク、プレナム。
  3. Kline、P.(1991)。インテリジェンス。心理測定ビュー。Routledge。

4

直交次元の問題は、コンポーネントが解釈できない可能性があることです。従って、斜めの回転(すなわち、非直交次元)は技術的にあまり満足できないが、そのような回転は時々、結果として生じるコンポーネントの解釈性を向上させる。


4

基本ポイント

  • ローテーションにより、コンポーネントの解釈をより明確にすることができます
  • 斜めの回転は、多くの場合、より理論的な意味を持ちます。つまり、観測された変数は、相関するコンポーネントの数が少ないという観点から説明できます。

  • 10はすべての測定能力をテストします。すべてのテストは相互相関していますが、口頭または空間テスト内の相互相関は、テストタイプ全体よりも大きくなっています。節約的なPCAには、言葉と空間の2つの相関コンポーネントが含まれる場合があります。理論と研究は、これら2つの能力が相関していることを示唆しています。したがって、斜め回転は理論的に理にかなっています。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.