新しい集団におけるアンケートの検証


8

医学生の態度構成を測定することを目的とする20項目のアンケートに400の回答があります。機器は米国で医学生の1年間検証され、公開されたデータは非常に「クリーン」です。すべてのritc値> 0.3、アルファ0.84、安定した4因子構造のPCAなど。私のサンプルでは、 ritc <0.2を持つ20のアイテムと文化的サブポピュレーション(n = 70)では、これらのritc値はゼロ/負です。すべてのitmesを保持している場合、ritcが低いものは、どの要素にもロードされないか、2項目の要素(要素4)に分類されません。これは(調査したいと思います)これは次のいずれかが原因であると仮定します。または(ii)プログラムのすべての段階で生徒からの回答があり、スケールアイテムで十分にキャプチャされていない構成に発達面があるため。これを調査できる統計検定はありますか?

ritcのあるアイテムをスケールから削除する必要がありますか。削除する場合は、最低から順に削除します。どの時点でアイテムの削除を停止する必要がありますか/アンケートから何かを紛失しましたか?メジャーとマイナーのサブポピュレーションの間でスケールの因子構造を比較したい場合、これをどのように試行するか、またはマイナーサブサンプルが小さすぎて結論を導き出せないのですか?参考文献をいただければ幸いです。

最後に、スケールを検証する目的は、介入前および介入後のスコアを使用して介入の有効性を判断するためにスケールを使用することです。アイテムのritcが低い場合、実験的な設定でスケールの信頼性に影響を与える可能性があると思います。または私は間違っていますか?発達的側面を持つ構成要素を測定するために設計されたスケールの有用性を決定する統計的方法はありますか?つまり、学生が態度構成要素の「より多く」を開発するときにすべての項目が適切に機能しますか?


1
「ritc」とは何ですか?
ガン-モニカの回復

+1から@Gungへ。私も知りませんが、私の学位は心理測定学です。
Peter Flom

それはアイテム-に、スケールの各項目の合計相関値を補正した場合typing-私が予想していた通りのHi-申し訳ありません出てきませんでした
スージー・

1
あなたはたくさん起こっています。前後に十分な数があると、このサイトを介していくつかの質問に満足のいく方法で答えられるかもしれませんが、それ以上の進歩を遂げるには、コンサルタントの詳細な助けが必要になるでしょう。
rolando2 14年

2
@ rolando2に同意します。ただし、70の回答者に基づく20の項目の因子分析に依存するのが適切であるかどうかは簡単に思います。
David

回答:


1

@suziラッシュ分析の基礎となる特性の1つは、メジャーがサブグループに対して不変であることです。このプロパティは、コンピュータ適応テストとテスト等化の開発をサポートします。このメジャーの不変性が母集団で当てはまる場合、微分項目機能(DIF)はありません。サンプルを支援するために、各サブグループに対してラッシュ分析を実行し、各サブグループの各アイテムの機能を比較できます。アイテムメジャーの差が0.50ロジットを超える(またはメジャーの95%信頼区間を超える)場合、DIFが存在し、アイテムは不変ではありません。サブグループに70人以上の被験者がいる限り、大丈夫です。

この原則の適用に関する優れた論文は、「アイテムパラメータ推定値の不変性のテストとしてのラッシュフィット統計」、Smith、Richard M.およびSuh、Kyunghee、Journal of Applied Measurement 4(2)153-163です。

コメントで述べたように、これは大きなフィールドであり、あなたは助けを必要とするかもしれません。論文が可能な場合は、Rasch SIGを通じて支援を求めることができます。ソフトウェアには、Winsteps、Facets、RUMM、eRm、およびRの他のプログラムが含まれます。

お役に立てれば。


3
差分アイテムが機能していませんか?
Behacad 2014年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.