順序レベルのデータを間隔レベルに変換する簡単な方法はありますか(逆の方法で行うのと同じように)?また、ExcelまたはSPSSで実行可能ですか?
データがある、たとえば:序数レベルで10の質問(0-5スケール、0 = "not at all"、5 = "all the time"など)、それらを適切に処理できるように変換したいパラメトリックテスト用の間隔レベルデータ(正規分布、問題外のノンパラメトリックテスト)。
答えに非常に感謝します!
順序レベルのデータを間隔レベルに変換する簡単な方法はありますか(逆の方法で行うのと同じように)?また、ExcelまたはSPSSで実行可能ですか?
データがある、たとえば:序数レベルで10の質問(0-5スケール、0 = "not at all"、5 = "all the time"など)、それらを適切に処理できるように変換したいパラメトリックテスト用の間隔レベルデータ(正規分布、問題外のノンパラメトリックテスト)。
答えに非常に感謝します!
回答:
この応答では、測定の観点から考えられるモデルについて説明します。ここでは、一連の観測された(マニフェスト)相互に関係する変数、または測定値が与えられます。その共有分散は、明確に識別されているが直接観測できない構造を測定すると想定されています(一般的に、反射的に方法)、潜在変数と見なされます。潜在特性測定モデルに慣れていない場合は、次の2つの記事をお勧めします:心理測定学者の攻撃、 Denny Borsbooom、およびLatent Variable Modelling:A Survey、Anders SkrondalおよびSophia Rabe-Hesketh。複数の応答カテゴリを持つアイテムを処理する前に、まずバイナリインジケータを少し回避します。
順序レベルのデータを間隔スケールに変換する1つの方法は、ある種のアイテム応答モデルを使用することです。よく知られた例は、ラッシュモデルです。これは、従来のテスト理論から並列テストモデルの概念を拡張して、バイナリスコア項目に対処します。一般的な(ロジットリンクを使用した)混合効果線形モデル(一部の「最新」ソフトウェア実装)を通じて、特定のアイテムを支持する確率は「アイテムの難易度」と「人の能力」の関数です(存在しないと仮定)測定されている潜在特性の位置と同じロジットスケールのアイテムの位置との相互作用(追加のアイテム識別パラメーターを介して取得できます)、または個人固有の特性との相互作用は、差分アイテム機能と呼ばれます)。基礎となるコンストラクトは一次元であると想定されており、Raschモデルのロジックは、回答者が特定の「コンストラクトの量」を持っているだけである-被験者の責任(彼/彼女の「能力」)について話しましょう、、このコンストラクトを定義するアイテム(「難易度」)も同様です。興味深いのは、測定スケールθでの回答者の場所とアイテムの場所の違いですです。具体例を挙げて、「不安以外に集中するのが難しいと思った」(はい/いいえ)という質問を考えてください。不安障害に苦しんでいる人は、一般の人々から採取されたうつ病または不安関連障害の過去の履歴がないランダムな個人と比較して、この質問に肯定的に答える可能性が高くなります。
不安に関連する障害を評価する較正済みアイテムバンクを構築することを目的とする米国の大規模な研究から導出された29のアイテム応答曲線の図を以下に示します(1,2)。サンプルサイズはです。探索的因子分析により、スケールの単次元性(第1固有値が第2固有値(17倍)を大きく上回り、信頼性の低い第2因子軸(1を少し上回る固有値)が並列分析で確認された)が確認され、このスケールは信頼性を示していますクロンバッハのアルファ(α = 0.971、95%ブートストラップCI [ 0.967 ; 0.975 ]で評価される許容範囲内のインデックス)。最初に、各項目に対して5つの応答カテゴリ(1 = 'Never'、2 = 'Rarely'、3 = 'Sometimes'、4 = 'Often'、および5 = 'Always')が提案されました。ここでは、バイナリスコアの応答のみを検討します。
(ここでは、リッカートタイプのアイテムへのレスポンスはバイナリレスポンス(1/2 = 0、3-5 = 1)として記録されており、各アイテムは個人間で同等に差別的であるため、アイテムカーブの勾配(ラッシュモデル)。)
ご覧のとおり、xの右側にいる人、潜在的な特性(不安)を反映軸のは、この特性をより多く表現すると考えられており、「私は恐怖を感じました」(恐ろしいと感じる) )または「突然パニックを感じました」(パニック)が左にいる人よりも多い(正常な人口、ケースとは考えられない)。一方、一般集団の誰かが眠りにつくのに苦労していると報告することはありそうもないことではありません:潜在特性の中間の範囲にいる人、たとえば0ロジット、スコア3以上の確率約0.5です(これはアイテムの難易度です)。
polytomousアイテム:注文したカテゴリを持つ、いくつかの選択肢がある部分信用モデル、評価スケールモデル、または段階的応答モデル、名前を付けるが、ほとんどの応用研究に使用されていることをいくつか。最初の2つはIRTモデルのいわゆる「ラッシュファミリー」に属し、次の特性を共有します。(a)応答確率関数の単調性(項目/カテゴリー応答曲線)、(b)個々の合計スコアの十分性(潜在的パラメータは固定と見なされます)、(c)アイテムへの応答が潜在的な特性に依存する独立したものであることを意味するローカル独立性、および(d)差分アイテム機能の欠如 つまり、潜在的な特性を条件として、応答は外部の個人固有の変数(例:性別、年齢、民族、SES)に依存しません。
前の例を、5つの応答カテゴリが効果的に説明される場合に拡張すると、患者は、不安関連障害の前兆がない一般集団からサンプリングされた誰かと比較して、応答カテゴリ3から5を選択する可能性が高くなります。上記の二項項目のモデリングと比較して、これらのモデルは累積的(たとえば、3対2以下の回答の確率)または隣接カテゴリのしきい値(3対2の回答の確率)のいずれかを考慮します。カテゴリデータ分析(第12章)。前述のモデルの主な違いは、1つの応答カテゴリから別の応答カテゴリへの遷移の処理方法にあります。部分クレジットモデルは、特定のしきい値位置と潜在特性のしきい値位置の平均との差が等しい、または評価尺度モデルに反して、アイテム全体で均一です。これらのモデルのもう1つの微妙な違いは、一部のモデル(制約のない段階的応答モデルや部分的信用モデルなど)がアイテム間で不均等な識別パラメーターを許可することです。Reeve and Fayersによるアンケート項目とスケールプロパティを評価するための項目応答理論モデリングの適用、または項目応答理論の基礎を参照してください。 Frank B. Bakerによる参照してください。
前述のケースでは、二分法でスコア付けされたアイテムの応答確率曲線の解釈について説明したため、同じターゲットアイテムを強調して、段階的応答モデルから派生したアイテム応答曲線を見てみましょう。
(制約のない段階的応答モデル。アイテム間の不平等な差別化を可能にします。)
ここでは、次の観察結果を考慮する必要があります。
真の測定モデルと見なされることに加えて、Raschモデルを魅力的なものにしているのは、十分な統計量としての合計スコアを潜在スコアのサロゲートとして使用できることです。さらに、充足性プロパティは、モデル(人とアイテム)パラメーターの分離可能性を容易に暗示します(ポリトーマスアイテムの場合、アイテムの応答カテゴリのレベルですべてが適用されることを忘れてはなりません)。
R実装によるIRTモデル階層の適切なレビューは、Journal of Statistical Software:Extended Rasch Modeling:The eRm Package for the Application for Rで公開されているMairとHatzingerの記事で入手できます。他のモデルには、対数線形モデル、モッケンモデルのようなノンパラメトリックモデル、またはグラフィカルモデルが含まれます。
Rとは別に、Excelの実装については知りませんが、このスレッドでいくつかの統計パッケージが提案されました。アイテム応答理論の適用を開始する方法と使用するソフトウェアは?
最後に、測定モデルに頼らずにアイテムのセットと応答変数の間の関係を調べたい場合、最適なスケーリングによる変数量子化の形式も興味深い場合があります。これらのスレッドで説明したR実装とは別に、SPSSソリューションも関連するスレッドで提案されました。
Alan Agrestiは、著書 『序列カテゴリーデータの分析』でいくつかを取り上げています。そのうちの1つはリディットです。これについてはブログで説明します