項目応答理論と確証的因子分析


14

項目応答理論と確認的因子分析の核となる、意味のある違いは何かと思っていました。

計算に違いがあることを理解しています(アイテム対共分散に重点を置いています;対数線形対線形)。

しかし、私はこれが上位レベルの観点から何を意味するのか見当がつかない-これは、状況によってはIRTがCFAよりも優れていることを意味するのか または、わずかに異なる最終目的のために?

研究文献のスキャンがIRTとCFAの核となる違いの有用な比較よりも多くのIRTとCFAの説明をもたらしたため、どんな黙想も有用です。

回答:


7

@Philchalmersの答えは適切です。フィールドのリーダーの1人であるMuthen(Mplusの作成者)からの参照が必要な場合は、ここに行きます:(直接引用を含めるように編集)

MPlusユーザーからの質問:論文のバイナリCFAとIRTの現在の類似点と相違点を説明し、説明しようとしています。カテゴリカルCFAのMplusのデフォルトの推定方法はWLSMVです。IRTモデルを実行するには、マニュアルの例で、推定方法としてMLRを使用することを推奨しています。MLRを使用する場合、データ入力は依然として四角相関行列ですか、それとも元の応答データ行列が使用されていますか?

Bengt Muthenの反応:カテゴリ変数のCFAとIRTに違いはないと思います。それは時々主張されますが、私は同意しません。通常使用される推定量は異なる場合がありますが、必須ではありません。MLRは生のデータを使用しますが、サンプルの四角相関行列は使用しません。... ML(R)アプローチは、例えばBockの研究で説明されている「周辺ML(MML)」アプローチと同じです。したがって、生データを使用し、数値積分を使用して因子を統合します。MMLは、たとえばRaschアプローチで使用される「条件付きML」とは対照的です。

通常の要因、プロビット(通常のオジーブ)項目と要因の関係、および条件付き独立性を仮定すると、MLとWLSMVの仮定は同じです。これは、これらの仮定が、カテゴリーの結果の背後にある多変量正規の根底にある連続潜在応答変数を仮定することに対応しているためです。そのため、WLSMVは1次および2次の情報のみを使用しますが、MLは最上位の情報に到達します。ただし、情報の損失はわずかです。MLはこれらのサンプルの四重項にモデルを適合させないため、WLSMVは別の方法で疎外されていると言えます。モデルの違いではなく、推定量の違いの問題です。

WebサイトにIRTに関するメモがあります。

http://www.statmodel.com/download/MplusIRT2.pdf

ただし、ML(R)アプローチはIRT MMLで使用されているものと何も変わりません。

出典:http : //www.statmodel.com/discussion/messages/9/10401.html?1347474605


2
Muthenからの引用文をコピーして回答に貼り付けていただけますか?リンクのみの回答は、特にリンクが腐敗する傾向があるため、一般的に眉をひそめています。
アメーバは、モニカーを復活させる

2
彼が非常に狭い方法でIRTを定義しているように見えるので、ここのMuthenの声明に同意するかどうかはわかりません。はい。2PLおよび段階的応答モデルは、優れた標準的なリンク機能を備えているため、SEMフレームワークで理解できます。したがって、他の十分な統計(ポリコリック相関など)を使用して表現できます。しかし、3PLモデル、理想点モデル、部分補償モデルなど、他の一般的なIRTモデルはどうでしょうか?確かに、一部のモデルはSEMフレームワークで理解できますが、IRTについての私の意見はまだ残っていると思います。
フィルチャーマーズ

17

ある意味では、CFAとIRTは同じ布から切り取られます。しかし、多くの点で彼らは全く異なっています。CFA、またはより適切なアイテムCFAは、カテゴリ項目間の特定のタイプの共変動を説明するための構造方程式/共分散モデリングフレームワークの適応です。IRTは、変数で1次および2次の情報のみを使用せずに、カテゴリ変数の関係をより直接的にモデリングすることです(完全な情報であるため、一般に要件は厳密ではありません)。

アイテムCFAには、SEMフレームワーク内に収まるという点でいくつかの利点があります。したがって、他の変数との関係の多変量システムに非常に幅広い用途があります。一方、IRTは主にテスト自体に焦点を当てていますが、共変量をテストに直接含めることもできます(たとえば、説明用のIRTに関するトピックを参照)。IRTフレームワークでは、アイテムモデリングの関係がはるかに一般的であり、非単調、ノンパラメトリック、または単純にカスタマイズされたアイテム応答モデルは、十分性を心配する必要がないため、簡単に対処できることもわかりました。ポリコリック相関行列を使用する方法。

どちらのフレームワークにも長所と短所がありますが、一般に、モデリングの抽象化/推論のレベルが変数システム内の関係に焦点を当てている場合、CFAはより柔軟です。一方、テスト自体(およびその中の項目)が関心のある焦点。


素晴らしい-これは素敵で明確な概要です。フィルありがとう
SimonsSchus 14年

2
これは受け入れられた答えであるはずです。
ヴラディスラフ・ドヴガレス

2

Yves Rosseelが2014年のワークショップのスライド91〜93で簡単に説明していると思います:http : //www.personality-project.org/r/tutorials/summerschool.14/rosseel_sem_cat.pdf

Rosseelから取得(2014、上記のリンク):

完全な情報アプローチ:限界最尤

起源:IRTモデル(Bock&Lieberman、1970など)およびGLMM

...

IRTとの接続

•SEMとIRTの理論的な関係は十分に文書化されています。

Takane、Y.、およびDe Leeuw、J.(1987)。項目応答理論と離散変数の因子分析との関係について。Psychometrika、52、393-408。

Kamata、A.、&Bauer、DJ(2008)。因子分析モデルとアイテム応答理論モデルの間の関係に関する注記。構造方程式モデリング、15、136-153。

Joreskog、KG、およびMoustaki、I。(2001)。順序変数の因子分析:3つのアプローチの比較。多変量行動研究、36、347-387。

それらはいつ同等ですか?

•プロビット(通常のオジーブ)対ロジット:両方のメトリックが実際に使用されます

•バイナリアイテムの単一要素CFAは、2パラメータIRTモデルと同等です(Birnbaum、1968):

CFAの場合:... IRTの場合:...(スライドを参照)

•多元的(通常)項目の単一因子CFAは、段階的応答モデルと同等です(Samejima、1969)

•3パラメータモデルに相当するCFAはありません(推測パラメータ付き)

•Raschモデルはバイナリアイテムの単一因子CFAと同等ですが、すべての因子負荷が等しくなるように制約されます(プロビットメトリックはロジットメトリックに変換されます)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.