PCAスコアの解釈


16

誰かがPCAスコアの解釈に役立つことができますか?私のデータは、クマに対する態度に関するアンケートから得たものです。積載量によると、私は主成分の1つを「熊の恐怖」と解釈しました。その主成分のスコアは、各回答者がその主成分までどのように測定するかに関連していますか?


あなたの質問への短い答えはYESです。
アメーバは

回答:


13

基本的に、因子スコアは、因子負荷によって重み付けされた生の応答として計算されます。したがって、最初の次元の因子負荷を調べて、各変数が主成分にどのように関係するかを確認する必要があります。特定の変数に関連する高い正の(または負の)負荷を観察するということは、これらの変数がこのコンポーネントに正の(または負の)貢献をすることを意味します。したがって、これらの変数のスコアが高い人は、この特定のディメンションでより高い(またはより低い)因子スコアを持つ傾向があります。

相関円を描くと、最初の主軸に「正」と「負」(存在する場合)を与える変数の一般的な概念を理解するのに役立ちますが、Rを使用している場合は、FactoMineRパッケージとdimdesc()機能。

USArrestsデータの例を次に示します。

> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1)  # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
         correlation  p.value
Assault        0.918 5.76e-21
Rape           0.856 2.40e-15
Murder         0.844 1.39e-14
UrbanPop       0.438 1.46e-03
> res$var$coord  # show loadings associated to each axis
         Dim.1  Dim.2  Dim.3   Dim.4
Murder   0.844 -0.416  0.204  0.2704
Assault  0.918 -0.187  0.160 -0.3096
UrbanPop 0.438  0.868  0.226  0.0558
Rape     0.856  0.166 -0.488  0.0371

最新の結果からわかるように、最初の次元は主に(あらゆる種類の)暴力行為を反映しています。個々のマップを見ると、右側にある州がそのような行為が最も頻繁に発生している州であることは明らかです。

代替テキスト 代替テキスト

また、この関連する質問に興味があるかもしれません:主成分スコアとは何ですか?


5

私にとって、PCAスコアは、より少ない変数でデータセットを説明できる形式でのデータの再配置にすぎません。スコアは、各アイテムがコンポーネントにどの程度関連しているかを表します。因子分析ごとに名前を付けることができますが、PCAは(因子分析のように)共通に保持されている要素だけでなく、データセットのすべての分散を分析するため、潜在変数ではないことに注意してください。


はい、FAとは対照的に、PCAにはエラーのモデルは組み込まれていないと言ってもいいでしょう。その特定のポイントに対して+1しました。PCAから抽出された主成分が真のLVであるということではなく、「考慮することは理にかなっています」と述べたことに注意してください。ただし、スケールの信頼性や測定モデルの評価に関心がない限り、PCAを使用するかFAを使用するかにほとんど違いはありません。現在、データ分析は、変数間の相関関係の説明や被験者のグループの発見に関係していることが多いため、階乗空間の1つまたは複数の次元を解釈する考えがあります。(...)
chl

(...)FactoMineRにはワインに関するデータセットが含まれており、Michel Tenenhausによって行われたように、多くのファクターメソッドを使用してそれ(PCA、MFA)、さらにはPLSまたはCCAで遊ぶことができます。
chl

@chl、パッケージに関するヒントをありがとう、私はそれをチェックします。PCA対FAでは、ある程度まで同意します。私は、特定の因子構造の価値を評価するのに非常に有用であるとの共通性(共通分散)推定に資金を提供するため、ほとんどのアプリケーションにFAを好みます。ただし、それは個人的な好みかもしれません。
-richiemorrisroe

あなたは完全に正しい(それは非常に明確にされたので、私はすでにあなたの以前の応答を支持した)。(ローテーションされていない)PCAには、CA、MFA、MCAとともに、データ分析(特にフランスの学校)に独自の歴史があるだけです。一方、Paul Klineには、性格調査でのFAの使用に関する2つの非常に素晴らしい本があります。そして、William Revelleの今後の本はRユーザーのために揺れるはずです:)まあ、いずれにせよ、これらは相関行列の構造を分析するための有用なツールであることに同意すると思います。
chl

0

PCAの結果(異なるディメンションまたはコンポーネント)は、一般的に、コンポーネントの1つが「クマの恐怖」であると仮定するのは間違っていると思う本当の概念に変換することはできません。主成分分析手順は、データマトリックスを、同じまたはより少ない次元の新しいデータ行列に変換します。結果の次元の範囲は、分散をよりよく説明するものから、より少ない説明をするものまでです。このコンポーネントは、元の変数と計算された固有ベクトルの組み合わせに基づいて計算されます。Overal PCAプロシージャは、元の変数を直交変数(線形独立)に変換します。これがあなたがpca手順について少し明確にするのに役立つことを願っています


いくつかの変数の線形結合が、因子軸への各変数のある種の重み付き寄与を反映していると解釈できることに同意しますか?
chl

はい、まさにそれです。
マリアナ・ソファー

それでは、なぜ名前を付けられないのですか?変数はマニフェスト変数と見なされるだけであり、場合によっては、重み付きの組み合わせを潜在的な(観察されない)要因を反映するものと見なすのが理にかなっています。
chl
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.