因子分析の前提条件は何ですか?


11

[クラシック、線形] 因子分析(FA)、特にFAの前(および場合によっては後で)に行われる仮定を本当に理解しているかどうかを確認したいと思います。

一部のデータは最初に相関する必要があり、それらの間には可能な線形関係があります。因子分析を行った後、データは通常分布され(各ペアの2変量分布)、因子(共通と詳細)の間に相関はなく、1つの因子の変数と他の因子の変数の間に相関はありません。

それが正しいか?

回答:


12

線形FAの入力データの仮定(ここでは、FA モデルの内部の仮定/プロパティについて、または結果の適合品質のチェックについては話していません)。

  1. スケール(間隔または比率)入力変数。つまり、項目は連続的な測定値であるか、離散的な量的尺度で測定されている間は連続的であると概念化されています。線形FAの序数データはありません(読み取り)。バイナリデータも回避する必要があります(thisthisを参照)。線形FAは、潜在的な共通および一意の要素が継続的であると想定しています。したがって、ロードする観測変数も連続でなければなりません。
  2. 相関関係は線形です。線形FAは、ピアソン相関、共分散、余弦などのSSCPタイプのアソシエーションマトリックスに基づいて実行できます(一部のメソッド /実装ではピアソン相関のみに制限される場合があります)。これらはすべて線形代数積であることに注意してください。共分散係数の大きさがより反映していることにもかかわらず、単に直線よりも関連して、FAの直線でモデル化は線形である共分散が使用されている場合でも、自然の中で:変数が要因の線形結合でありますしたがって、結果の関連付けには線形性が含まれます。非線形の関連付けが優勢であると思われる場合は、線形FAを実行しないでください。または、データのいくつかの変換によって最初にそれらを線形化しようとしないでください。そしてスピアマンまたはケンドール相関関係にFAリニアベースません白金(Pt。4 )。
  3. 外れ値はありません -これは、非堅牢な方法と同じです。ピアソン相関と類似のSSCPタイプの関連付けは外れ値に敏感であるため、注意してください。
  4. 相応に高い相関が存在します。FAは相関関係の分析です。すべてまたはほとんどすべての相関関係が弱い場合、その用途は何ですか。-使用しません。ただし、「適度に高い相関」とは、研究分野によって異なります。また、非常に高い相関関係を受け入れる必要があるかどうかについては、興味深い多様な質問があります(たとえば、PCAに対するそれらの影響については、ここで説明します)。データが無相関でないかどうかを統計的にテストするには、バートレットの球形性のテストを使用できます。
  5. 部分相関は弱く、因子は十分に定義できます。FAは、相関関係のあるアイテムのペアをロードするだけではなく、より一般的な要素であると想定しています。実際、エクスプロダトリーFAで3項目未満の負荷がまともな要素を抽出しないようにというアドバイスさえあります。確認的FAでは、3 +のみが保証された識別構造です。Heywood事件と呼ばれる抽出の技術的な問題は、背後にある理由の1つとして、要素が少なすぎるという状況にあります。Kaiser-Meyer-Olkin(KMO)の「サンプリングの妥当性測定」の推定値は、完全な相関と比較してデータの部分相関がどの程度弱いかを推定します。すべてのアイテムおよび相関行列全体に対して計算できます。
  6. 多重共線性なし。FAモデルでは、すべてのアイテムがそれぞれ一意の因子を持ち、それらの因子が直交していると想定しています。したがって、2つのアイテムが平面を定義する必要があり、3つのアイテム-3Dスペースなど:p相関するベクトルは、p 次元空間にまたがって、相互に垂直なp個の固有コンポーネントを収容する必要があります。したがって、理論上の理由で特異点はありません(そのため、言うまでもなく自動的に;そしてより良い)。ただし、完全な多重共線性は許可されていません。それでも、ほとんどのFAアルゴリズムで計算上の問題が発生する可能性があります(参照)。1n observations > p variablesn>>p
  7. 分布。一般に、線形FAは入力データの正規性を必要としません。適度に歪んだ分布が許容されます。二峰性は禁忌ではありません。正規性は実際、モデル内の一意の因子(それらは回帰誤差として機能します)に対して想定されますが、共通因子および入力データに対しては想定されません(参照)。それでも、データの多変量正規性は、抽出のいくつかの方法(つまり、最尤)および漸近検定を実行することによって、追加の仮定として必要になる場合があります。

1 FAのULS / minres メソッドは、特異な非psd相関行列でも機能しますが、厳密には理論的にはそのような分析は疑わしいです。


あなたが読むことができる、この記事を、それは少し違うように見えました。
WhiteGirl 2017

もしそうならBinary data should also be avoided、因子分析法は他に何ができbinary dataますか?
kittygirl

親愛なるttnphns; データが正常であると想定されており、他のオンラインでは正常性が不要であることを示していることについて、あなたは言及していません。私のクエリは、潜在変数が正常であると想定され、観測が因子の加重和としてモデル化されている場合、これは観測の正規分布を意味しないのですか?(これがばかげた質問であるとは申し訳ありません)
user2957945

@ user2957945、パラグラフ7は正常性について述べています。正規性の仮定は、因子抽出のいくつかの方法、および因子分析に付随的に付随するいくつかの統計検定で必要です。あなたの質問に対して:はい、因子が正常に分布し、エラーも正常に分布している場合、マニフェスト変数も正常であることを意味します。
ttnphns

ああ、ありがとう@ttnphns; ご迷惑をおかけして申し訳ありません-私はどうやってそれを逃したのかよくわかりません。あなたの助けに感謝。
user2957945

9

ほとんどの場合、因子分析はそれ自体統計検定なしで行われます。回帰、構造方程式モデリングなどの方法よりも主観的で解釈的です。そして一般的に、仮定を伴う推論テストです。p値と信頼区間を正しくするためには、これらの仮定を満たさなければなりません。

ここで、因子の数を選択する方法が最尤法に設定されている場合、これに伴う仮定があります。因子分析に入力される変数は正規分布を持つということです。

入力変数が非ゼロの相関関係を持つことは、それが真実でなければ、因子分析結果は(おそらく)役に立たないという一種の仮定です。入力変数のセットの背後にある潜在変数として因子は現れません。

「因子間には相関がなく(共通と詳細)、1つの因子からの変数と他の因子からの変数間に相関がない」限り、これらは因子分析者が普遍的に仮定するものではありませんが、いずれかの条件(または近似)それの)望ましいかもしれません。後者は、成立する場合、「単純構造」として知られています。

「仮定」として扱われることもある別の条件があります。入力変数間のゼロ次(バニラ)相関が大きな部分相関によって圧倒されないことです。簡単に言えば、これは、関係が一部の組み合わせでは強く、他の組み合わせでは弱いということです。そうしないと、結果は「濁った」ものになります。これは単純な構造の望ましさに関連しており、Kaiser-Meyer-Olkin統計またはKMOを使用して実際に評価できます(正式には「テストされていません」)。.8または.9に近いKMO値は、通常、有益な因子分析結果に非常に有望であると見なされます。一方、.5または.6に近いKMOは、あまり有望ではなく、0.5未満のKMO値は、アナリストに戦略の再考を促す可能性があります。


私が読んだように、その因子分析は変数とのいくつかの相関から始まり、この相関をますます明確にするようにしています
Sihem

1
因子分析の適用後、直交回転を使用した場合、因子間に相関がないことが確実になります
Sihem

2

探索的因子分析の基礎となる仮定は、次のとおり
•測定間隔または比率レベル
•ランダムサンプリング
観測変数間の関係が線形である•
正規分布(各観測変数)•
•二変量正規分布(観測変数の各ペア)
•多変量正規性
から上方SASファイル

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.