回答:
基本的に、因子スコアは、因子負荷によって重み付けされた生の応答として計算されます。したがって、最初の次元の因子負荷を調べて、各変数が主成分にどのように関係するかを確認する必要があります。特定の変数に関連する高い正の(または負の)負荷を観察するということは、これらの変数がこのコンポーネントに正の(または負の)貢献をすることを意味します。したがって、これらの変数のスコアが高い人は、この特定のディメンションでより高い(またはより低い)因子スコアを持つ傾向があります。
相関円を描くと、最初の主軸に「正」と「負」(存在する場合)を与える変数の一般的な概念を理解するのに役立ちますが、Rを使用している場合は、FactoMineRパッケージとdimdesc()
機能。
USArrests
データの例を次に示します。
> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1) # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
correlation p.value
Assault 0.918 5.76e-21
Rape 0.856 2.40e-15
Murder 0.844 1.39e-14
UrbanPop 0.438 1.46e-03
> res$var$coord # show loadings associated to each axis
Dim.1 Dim.2 Dim.3 Dim.4
Murder 0.844 -0.416 0.204 0.2704
Assault 0.918 -0.187 0.160 -0.3096
UrbanPop 0.438 0.868 0.226 0.0558
Rape 0.856 0.166 -0.488 0.0371
最新の結果からわかるように、最初の次元は主に(あらゆる種類の)暴力行為を反映しています。個々のマップを見ると、右側にある州がそのような行為が最も頻繁に発生している州であることは明らかです。
また、この関連する質問に興味があるかもしれません:主成分スコアとは何ですか?
私にとって、PCAスコアは、より少ない変数でデータセットを説明できる形式でのデータの再配置にすぎません。スコアは、各アイテムがコンポーネントにどの程度関連しているかを表します。因子分析ごとに名前を付けることができますが、PCAは(因子分析のように)共通に保持されている要素だけでなく、データセットのすべての分散を分析するため、潜在変数ではないことに注意してください。
PCAの結果(異なるディメンションまたはコンポーネント)は、一般的に、コンポーネントの1つが「クマの恐怖」であると仮定するのは間違っていると思う本当の概念に変換することはできません。主成分分析手順は、データマトリックスを、同じまたはより少ない次元の新しいデータ行列に変換します。結果の次元の範囲は、分散をよりよく説明するものから、より少ない説明をするものまでです。このコンポーネントは、元の変数と計算された固有ベクトルの組み合わせに基づいて計算されます。Overal PCAプロシージャは、元の変数を直交変数(線形独立)に変換します。これがあなたがpca手順について少し明確にするのに役立つことを願っています