因子分析で因子によって読み込まれるアイテム(変数)が2つ(またはそれ以下)だけであっても問題ありませんか?


10

SPSSで因子分析を行った20個の変数のセットがあります。研究のために、私は6つの要因を開発する必要があります。SPSSは、8つの変数(20のうち)が低い重みでロードされているか、いくつかの要因によって等しくロードされていることを示したため、それらを削除しました。残りの12個の変数は、6つの要素の2つのペアで読み込まれています。これは完全な構造です。私が望んでいたとおりですが、私と一緒に働いている教授の1人が、なぜ(またはどのような条件下で)正当化するのかを求めています因子分析は、因子ごとに3つ以上の項目がロードされた結果で有用であることが一般に知られているため、因子ごとに2項目のみを保持することが適切です。

誰かがこの問題について、できれば公開されたリファレンスも助けてくれますか?


単一のアイテムファクターは、そのアイテムのファクター負荷が高い場合も許容されます。
Meera Gang

「要素ごとに少なくとも3つの項目」は、保証された推奨事項です。因子のローテーション後、因子に2つまたは1つのアイテムがある場合、1)その因子によってロードされると予想されるより多くの変数を取得するか、2)分析をやり直してより少ない因子を抽出するか、3)そのままにします。結果はそのままですが、「古くなった」要因を解釈せずに、「その要因は存在すると思いますが、現在、アイテムによって十分にサポートされていないため、解釈と結果から除外します」ただし、これら2つの推奨事項はすべて異なります。
ttnphns 2017

ここでの回答に加えて、stats.stackexchange.com / a / 198684/3277(poit 5)を参照してください。「要素ごとに少なくとも3つのロードされたアイテム」が合理的な要件である理由。
ttnphns 2017

回答:


13

因子ごとに2つまたは3つの項目は、CFA(確認的FA)モデルの識別の問題です。

簡単にするために、各因子の分散を1に設定することでモデルが識別されると仮定します。また、相関する測定誤差がないと仮定します。

2つのアイテムを持つ単一因子モデルには、2つの負荷と2つの推定される誤差分散= 4つのパラメーターがありますが、分散共分散行列には3つの非自明なエントリしかないため、4つのパラメーターを推定するための十分な情報がありませんあなたが必要とすること。

3つのアイテムを持つ単一因子モデルには、3つの負荷と3つの誤差分散があります。分散共分散行列には6つのエントリがあり、注意深い分析検査によりモデルが正確に識別されていることが示され、パラメーター推定値を分散共分散行列エントリの関数として代数的に表すことができます。単一要素あたりのアイテム数が多いほど、モデルが過剰に同定され(パラメーターよりも自由度が高く)なるため、通常は問題ありません。

複数の因子がある場合、CFAモデルは常に各因子ごとに3+項目で識別されます(各因子の単純な測定モデルが識別されるため、おおまかに言えば、各因子の予測を取得し、それに基づいてそれらの共分散を推定できます)。ただし、各因子が母集団内の少なくとも1つの他の因子とのゼロ以外の共分散を持つ場合、因子ごとに2つの項目を持つCFAが識別されます。(そうでなければ、問題の因子はシステムから外れ、2項目の単一因子モデルは識別されません。)識別の証明はかなり技術的であり、行列代数の十分な理解が必要です。

Bollen(1989)は、第7章でCFAモデルの識別の問題について完全かつ完全に説明しています。244特に3および2インジケーターのルールに関する。


1
これは非常に適切な答えでした。私は、OPが探索的FA(EFA)について尋ねた(OPのために)だけコメントします。CFAがそれを期待しているので、EFAが「ファクターごとに3以上のロードされたアイテム」を持っていることは論理的です。答えでそれについてあなたが言わなかったことだけ。
ttnphns 2017

4

「1要素あたり3項目」の基準について聞いたことがありません。私は質問を逆転させて、あなたの教授にこの声明の健全な参照を考え出すように頼みます。

それ以外に、「研究のために、6つの要素を開発する必要があります。」言うべき奇妙なことです。

因子分析の基本的な目的は、1)測定された変数の(より大きな)数の基礎となる因子(多くの場合、心理的特性)を見つけることです。次に2)、因子負荷に基づいて、これらの因子が実際に何であるかを説明しようとします。

6つの要素を「開発」するのではなく、6つの要素を「測定しよう」とします。

ただし、クロスローディング(複数の要因によって読み込まれる変数)が存在する場合は、多くの場合、要因が互いに「相関しようとしている」ことを示しています。基本的にすべてが現実世界のすべてと相関していることを知っているので、これは理にかなっています。(直交バリマックスの代わりに)斜め回転を使用して分析にこの観測を実装すると、多くの相互負荷が取り除かれます。私見、それも理論的にはもっと健全です。

試してみると、要素ごとのアイテム数が増える可能性があります。それは(部分的に)あなたの問題も解決するかもしれません。


コメントをありがとうございました。なぜ私が使用しているモデルで6つの要素を説明できるのですか、私の教授は6つの要素の説明に反対していませんが、要素ごとに2項目しかない要素分析を使用してもよいのか説明を求めています。これはまだ問題のままです。
Mitja

@ pythonforspss.orgのサイトへようこそ。+ 1を参考にしてください。いくつかのメモ:因子ごとに少なくとも3つの変数が必要であると何度か言ったと聞きましたが、このルールの実質的な理由(または実際にある場合)がわかりません。OPのQを編集して英語をスムーズにしました。私はあなたが引用していたフレーズを入れて、前にあったものを置き換えました。これは理想的ではなかったかもしれませんが(OPが何を言おうとしているのかを翻訳する方法がわかりませんでした)、もしそうなら、それはMitjaのせいではなく、私のせいです。英語は多くのユーザーにとって第一言語ではないことを覚えておいてください。
gung-モニカの復活

因子ごとの3つの項目は共通の信念であり、レビュー段階で問題を引き起こす傾向があります(これは共通の信念であるため)。そうは言っても、あなたの共同性が高い(> 0.7)ならば、おそらく問題はありません。
richiemorrisroe

私の共同体は0.5以上です...
Mitja

factors are "trying to correlate" with each other神秘的な処方です。因子は、それらをどのように回転(モデル化)するかによって相関するか、または相関しません。非常に高い「クロスローディング」は、高い共通性を持つ変数を持つ直交因子で可能です。
ttnphns 2017

1

私は今、同じ問題を抱えています。これは、要素ごとに少なくとも3つのアイテムを使用することを推奨する記事です。ただし、例外的なケースでは、ファクターごとのアイテムに使用する場合があります(p.60)。http://www.sajip.co.za/index.php/sajip/article/download/168/165 私のWebベースの実験では、プレーヤーの情報を提供する変数が2つしかないため、私のケースは例外的なようです戦略と戦略力。いくつかの要因で2つのアイテムの使用を正当化するのにも役立つかもしれません。


1
:このウェブサイトは因子ルールごとに3つの変数の最小値をサポートする参照の数があるencorewiki.org/display/~nzhao/...
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.