リッカート項目で構成されるアンケートの因子分析


17

以前は、心理測定の観点からアイテムを分析していました。しかし今、私は動機や他のトピックに関する他のタイプの質問を分析しようとしています。これらの質問はすべてリッカート尺度に基づいています。私の最初の考えは、要因分析を使用することでした。なぜなら、いくつかの根本的な次元を反映するように質問が仮定されているからです。

  • しかし、因子分析は適切ですか?
  • 次元に関する各質問を検証する必要がありますか?
  • リッカート項目の因子分析の実行に問題はありますか?
  • リッカートやその他のカテゴリー項目について因子分析を実施する方法に関する優れた論文や方法はありますか?

私が正しく理解していれば、あなたの質問には少なくとも2つの異なるトピックが含まれています:(1)態度または動機付けスケールでのFAの使用、(2)そのようなスケールでの応答の「極端な」パターン(天井/床効果)の処理方法?
chl

回答:


22

これまで見てきたことから、FAは他の種類の評価尺度と同様に態度項目に使用されます。使用されるメトリックに起因する問題(つまり、「リッカートスケールは本当に数値スケールとして扱われますか?」)は長年の議論ですが、釣鐘型の応答分布を確認することで、連続測定として扱うことができます。それ以外の場合、非線形FAモデルまたは最適なスケーリングを確認します)は、Graded Response、Rating Scale、またはPartial Credit Modelなどの多発性IRTモデルによって処理される場合があります。後者の2つは、リッカートタイプのアイテムで使用されるしきい値距離が、応答形式(RSM)または特定のアイテム(PCM)の特性であるかどうかの大まかなチェックとして使用できます。

あなたの2番目の点に関して、例えば、態度や健康調査における反応分布は国によって異なることが知られています(例えば、中国人は西洋諸国から来るものと比較して「極端な」反応パターンを強調する傾向があります、例えば、X.-Y. (2007)潜在変数および関連モデルのハンドブック、Lee、S.-Y.(編集)、pp 279-302、North -オランダ)。そのような状況を私の頭の外で処理するいくつかの方法:

  • 対数線形モデル(限界アプローチ)を使用して、アイテムレベルでグループ間の強い不均衡を強調します(係数はオッズではなく相対リスクとして解釈されます)。
  • 上記で引用したSongのマルチサンプルSEMメソッド(ただし、そのアプローチでさらに作業を行うかどうかはわかりません)。

今、ポイントは、これらのアプローチのほとんどがアイテムレベル(天井/床効果、信頼性の低下、アイテム適合統計の不良など)に焦点を当てていることですが、理想から予想されるものから人々がどのように逸脱するかに関心がある場合オブザーバー/回答者のセット、私は代わりに人適合指数に焦点を合わせなければならないと思います。

このような統計は、INFITまたはOUTFIT平均二乗などのIRTモデルですぐに使用できますが、一般的にはアンケート全体に適用されます。さらに、アイテムのパラメータの推定は部分的に人のパラメータに依存するため(たとえば、限界尤度フレームワークでは、ガウス分布を仮定します)、外れた個人の存在は、潜在的に偏った推定と貧弱なモデル適合につながる可能性があります。χ2

Eid and Zickar(2007)が提案したように、潜在クラスモデル(回答者のグループ、たとえば極端なカテゴリと他のカテゴリで常に回答するグループを分離するため)とIRTモデル(アイテムパラメータと潜在的な人物の位置を推定するため)両方のグループの特性)が良い解決策のようです。他のモデリング戦略については、彼らの論文で説明されています(例:HYBRIDモデル、Holden and Book、2009も参照)。

同様に、展開モデルを使用して、一貫したコンテンツに依存しない応答カテゴリのパターンとして定義されている応答スタイル(たとえば、すべてのステートメントに同意する傾向)に対処することができます。社会科学または心理学の文献では、これはエクストリームレスポンススタイル(ERS)として知られています。参照(1〜3)は、それがどのように現れ、どのように測定されるかについてのアイデアを得るのに役立つ場合があります。

以下は、この主題の進展に役立つ可能性のある論文の短いリストです。

  1. ハミルトン、DL(1968)。極端な応答スタイルに関連付けられた人格属性Psychological Bulletin69(3):192–203。
  2. Greanleaf、EA(1992)。極端な応答スタイルの測定。世論56(3):328-351。
  3. デジョン、MG、スティーンカンプ、J.-BEM、フォックス、J.-P。、およびバウムガルトナー、H。(2008)。マーケティングリサーチにおける極端な応答スタイルを測定するためのアイテム応答理論の使用:グローバル調査。Journal of marketing research45(1):104-115。
  4. Morren、M.、Gelisen、J。、およびVermunt、JK(2009)。異文化間研究における極端な応答スタイルへの対処:制限された潜在クラス因子分析アプローチ
  5. ムーアズG.(2003)。潜在クラス因子アプローチによる応答スタイル行動の診断。性別の役割の態度と民族差別の認識の社会人口統計学的相関の再検討。品質と数量、37(3)、277-302。
  6. デジョン、MGスティーンカンプJB、フォックス、J.-P。、およびバウムガートナー、H。(2008)。マーケティング調査における極端な反応スタイルを測定するためのアイテム反応理論:グローバル調査。Journal of Marketing Research、45(1)、104-115。
  7. ジャワラス、KNおよびリプリー、BD(2007年)。リッカート態度データの「展開」潜在変数モデル。JASA、102(478):454-463。
  8. Moustaki、Knott、Mavridisのスライド、潜在変数モデルの外れ値を検出する方法
  9. Eid、M.およびZickar、MJ(2007)。混合ラッシュモデルによる応答スタイルの検出と人格および組織評価の偽装。von Davier、M.およびCarstensen、CH(編)、多変量および混合分布Raschモデル、pp。255–270、Springer。
  10. Holden、RR and Book、AS(2009)。ハイブリッドRasch潜在クラスモデリングを使用して、パーソナリティインベントリ上の偽者の検出を改善します。性格と個人差47(3):185-190。

ハミルトン(1968)とモレン、ゲリセン、バームント(2009)のリンク切れ。Google Scholarでも代替ソースを見つけることができませんでした(ただし、通常の古いGoogleをまだ試していない)
ニックスタウナー14

13

探索的因子分析(EFA)は、測定されていない(すなわち、潜在的な)因子の共通の影響を推測することにより、複数の項目間の相関関係を説明できる範囲を調べるために(心理測定などで)適切です。これが特定の意図でない場合は、代替分析を検討してください。例:

  • 一般的な線形モデリング(例えば、重回帰、正準相関、または(M)AN(C)OVA)
  • 確認的因子分析(CFA)または潜在特性/クラス/プロファイル分析
  • 構造方程式(SEM)/部分最小二乗モデリング

次元性は、EFAが対処できる最初の問題です。共分散行列の固有値を調べ(EFAを介してスクリープロットを作成するなど)、並列分析を実行してメジャーの次元を解決できます。(William Revelleの優れたアドバイスと代替案も参照してください。)限られた数の因子を抽出してEFAで回転させる前、またはCFA、SEM、またはなど。並列分析が多次元​​性を示しているが、一般的な(最初の)要因が他のすべてをはるかに上回る(つまり、はるかに大きな固有値を持つ/メジャーの分散の大部分を説明する)場合、バイファクター分析を検討してください(Gibbons&Hedeker、1992;Reise、Moore、&Haviland、2010

EFAおよびリッカート尺度評価の潜在因子モデリングでは、多くの問題が発生します。リッカートスケールは、連続データではなく、順序(つまり、カテゴリ、多トーラス、順序付き)データを生成します。通常、因子分析では、生データの入力は連続的であると想定され、人々はしばしば、ピアソンの製品モーメント相関の行列の因子分析を行います。これは連続データにのみ適しています。Reiseと同僚(2010)からの引用は次のとおりです。

通常の確認因子分析手法は、二分データまたは多倍数データには適用されません(Byrne、2006)。代わりに、特別な推定手順が必要です(Wirth&Edwards、2007)。ポリトーマスアイテムレスポンスデータを操作するには、基本的に3つのオプションがあります。1つ目は、ポリコリック行列を計算してから、標準因子分析法を適用することです(Knol&Berger、1991を参照)。2番目のオプションは、完全な情報項目因子分析を使用することです(Gibbons&Hedeker、1992)。3番目は、平均と分散の調整を伴う加重最小二乗などの順序付けられたデータ用に特別に設計された限定情報推定手順を使用することです(MPLUS;Muthén&Muthén、2009)

典型的な代替案の問題に関するWang and Cunningham (2005)の議論に基づいて、1つ目と3つ目のアプローチの両方を組み合わせることをお勧めします(つまり、ポリコリック相関行列で対角重み付き最小二乗推定を使用

最尤法を使用し、ピアソンの積率相関に基づいて非正常の序数データで確認因子分析を行った場合、この研究で生成された下方パラメーター推定値は、オルソン(1979)の調査結果と一致しました。言い換えれば、観測された順序変数の非正規性の大きさは、パラメーター推定の精度の主要な決定要因です。

この結果は、ババカスらの発見も裏付けています。(1987)。確証因子分析で多項相関入力行列で最尤推定が使用される場合、解は許容できないため、適合度の低い統計とともに有意なカイ二乗値をもたらす傾向があります。

研究者は、非正規のカテゴリカルデータを使用して構造方程式モデルを推定する際に、重み付き最小二乗推定器を使用するか、斜めに重み付けした最小二乗推定器を使用すべきかという疑問が残ります。重み付き最小二乗または対角重み付き最小二乗のどちらの推定も、変数の分布の性質に関する仮定を行わず、両方の方法は漸近的に有効な結果を生成します。それにもかかわらず、重み付き最小二乗推定は4次モーメントに基づいているため、このアプローチは頻繁に実際的な問題につながり、非常に計算負荷が高くなります。つまり、加重最小二乗推定は、中規模のモデル、つまり10個の指標を使用して、大規模および中小規模のサンプルサイズのモデルを評価する場合にロバスト性に欠けることがあります。

重み付き最小二乗推定と同じ懸念がDWLS推定に当てはまるかどうかは明らかではありません。それにもかかわらず、著者はその推定量を推奨しています。まだ手段がない場合:

  • R (R Core Team、2012)は無料です。2.15.2これらのパッケージには古いバージョン(例:)が必要です。
    • psychパッケージ(Revelle、2013)が含まれているpolychoric機能を。
      • このfa.parallel関数は、抽出する要因の数を識別するのに役立ちます。
    • lavaanパッケージ(Rosseel、2012)の提供は、潜在変数解析のための推定をDWLS。
    • semToolsパッケージには含まれていefaUnrotateorthRotateoblqRotate機能を。
    • mirtパッケージ(チャルマーズ、2012)項目反応理論を用いて代替案を約束申し出。

私は想像Mplus (Muthén&Muthén、1998年から2011年)は、あまりにも動作しますが、無料のデモ版は、半年以上の測定に対応できないだろう、とライセンス版は安くはありません。余裕があれば価値があるかもしれません。人々はMplusを愛しておりフォーラムを介したMuthénsのカスタマーサービスは素晴らしいです!

上記のように、DWLS推定は、非常に一般的な問題であり、リッカート尺度評価データでほぼ遍在する正規性仮定違反(単変量と多変量の両方)の問題を克服します。ただし、それは必ずしも実際的な結果ではありません。ほとんどのメソッドは、(重くによってバイアス)にはあまりにも敏感ではない小さな違反(参照は、「基本的に役に立たない」正規のテストですか?)。この質問に対する@chlの回答は、極端な応答スタイルの問題に関するより重要で優れたポイントと提案をもたらします。間違いなく、リッカート尺度の評価やその他の主観的なデータの問題。


参考文献
Babakus、E.、Ferguson、JCE、&Jöreskog、KG(1987)。確証的最尤因子分析の、測定スケールおよび分布の仮定の違反に対する感度。Journal of Marketing Research、24、222–228。
バーン、BM(2006)。 EQSによる構造方程式モデリング。 ニュージャージー州マーワー:ローレンス・エルバウム。
チャーマーズ、RP(2012)。mirt:R環境用の多次元アイテム応答理論パッケージ。Journal of Statistical Software、48(6)、1–29。http://www.jstatsoft.org/v48/i06/から取得。
Gibbons、RD、およびHedeker、DR(1992)。完全な情報アイテムのバイファクター分析。 Psychometrika、 57、423–436。
Knol、DL、およびBerger、MPF(1991)。因子分析と多次元アイテム応答モデルの経験的比較。多変量行動研究、 26、457–477。
ミュータン、LK、およびミューセン、BO(1998-2011)。Mplusユーザーガイド(第6版)。カリフォルニア州ロサンゼルス:Muthén&Muthén。
ミューセン、LK、およびミューセン、BO(2009)。Mplus(バージョン4.00)。[コンピューターソフトウェア]。カリフォルニア州ロサンゼルス:著者。URL:http://www.statmodel.com
Olsson、U.(1979)。多項相関係数の最尤推定値。Psychometrika、 44、443–460。
Rコアチーム。(2012)。R:統計計算のための言語と環境。R Foundation for Statistical Computing、ウィーン、オーストリア。ISBN 3-900051-07-0、URL:http://www.R-project.org/
Reise、SP、Moore、TM、およびHaviland、MG(2010)。バイファクターモデルと回転:多次元データが一義的なスケールスコアを生成する程度を調査します。 Journal of Personality Assessment、92(6)、544–559。http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/から取得。
W. Revelle(2013)。psych:パーソナリティと心理学的研究の手順。米国イリノイ州エヴァンストンのノースウェスタン大学。http://CRAN.R-project.org/package=psychから取得。バージョン= 1.3.2。
Rosseel、Y.(2012)。lavaan:構造方程式モデリングのためのRパッケージ。Journal of Statistical Software、48(2)、1〜36。http://www.jstatsoft.org/v48/i02/から取得。
Wang、WC、Cunningham、EG(2005)。General Health Questionnaireの確認因子分析における代替推定方法の比較。 Psychological Reports、 97、3–10。
ワース、RJ、エドワーズ、MC(2007)。項目要因分析:現在のアプローチと将来の方向。心理学的方法、 12、58〜79。http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/から取得。


(+11)私があなたの答えを逃した方法がわからない!
chl

ハ!ありがとう!これはしばらくそこに座っていました。私は、それが少し長すぎるか不明瞭であるか、または私が思っていたよりも議論の余地のある新しい方法に依存しているのではないかと思いました。ユーザー名にタグを使用する方法をまだ知らなかったようです。
ニックスタウナー

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.