PCAまたは因子分析における歪んだ変数


9

22の変数に基づいてSPSSの主成分分析(因子分析)を実行したいと考えています。ただし、一部の変数は非常に歪んでいます(SPSSの範囲から計算された歪度は2〜80です)。

だからここに私の質問があります:

  1. そのように歪んだ変数を保持する必要がありますか、それとも主成分分析で変数を変換できますか?はいの場合、どのように因子得点を解釈しますか?

  2. どのタイプの変換を行う必要がありますか?log10またはln?

  3. 元々、私のKMO(Kaiser–Meyer–Olkin)は0.413です。多くの文献では、最低でも0.5を推奨しています。それでも因子分析を行うことはできますか、またはKMOを0.5に上げるために変数を削除する必要がありますか?


5
注:PCAは因子分析と同じではありません。PCAはデータ削減方法であり、FAは潜在変数を見つける試みです。彼らは(常にではないが)同様の結果をもたらすことが多い
ピーター・フロム-モニカを復活させる

回答:


9
  1. PCAの歪度の問題は回帰の場合と同じです。分布の範囲全体に対して実際に長い場合、より長いテールは、実際には大きな外れ値のように振る舞います。フィット線(この場合は主成分)を強く引きます。影響力が高まるため、それ自体。平均からの距離が遠いため、その影響力が高まっています。PCAのコンテキストでは、非常に歪んだ変数を許可することは、データを中央揃えせずにPCAを実行する(つまり、相関行列ではなく余弦行列に基づいてPCAを実行する)と非常に似ています。ロングテールが結果に大きな影響を与える(そしてデータを許可する)か、許可しない(そしてデータを変換する)かを決定するのあなたです。この問題は、荷重の解釈方法とは関係ありません。

  2. 好きなように。

  3. KMOは、因子分析にデータを送信するために部分相関がかなり小さいかどうかを示すインデックスです。因子分析では、通常、因子が2つ以上の変数をロードすることを期待しているためです。あなたのKMOは十分に低いです。個々のKMO値が低い分析変数からドロップすると、より良い結果が得られます(これらはアンチイメージマトリックスの対角線を形成し、SPSS Factorプロシージャでこのマトリックスを表示するように要求できます)。変数を変形の少ない歪んだKMOに変換できますか?知るか。多分。KMOは主に主成分分析モデルではなく因子分析モデルで重要であることに注意してください。FAではペアワイズ相関を当てはめますが、PCAではそうではありません。


2

+1から@ttnphnsまで、ポイント2で少し拡張したいだけです。変換は、スキューを安定させるためによく使用されます。@ttnphnsが指摘するよう、分析を実行する前にこれらを使用します。対数変換は、Box-Coxファミリーの電力変換の一部です。。単なる対数よりも広い範囲の可能な変換を検討する必要があります(たとえば、平方根、逆数など)。異なる対数の底の選択は、変換の強さに影響を与えません。変換された変数を使用して数学的に作業する場合、自然対数の方が好ましい場合があります。これは、自然対数が場合によってはより簡潔な計算になる場合があるためです。それを気にしない場合は、解釈を容易にするベースを選択することをお勧めします。つまり、新しいスケールの各ユニットの増加は、ベースを表します-元のスケールの2倍の増加(たとえば、2を底とする対数を使用した場合、すべてのユニットは2倍の増加となり、10をベースとすると、すべてのユニットが10倍の増加になるなど)。データが変換されたスケールで複数のユニットにまたがるようなベースを選択します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.