アンケートの序数データを適切な間隔データに変換する方法は?


13

順序レベルのデータを間隔レベルに変換する簡単な方法はありますか(逆の方法で行うのと同じように)?また、ExcelまたはSPSSで実行可能ですか?

データがある、たとえば:序数レベルで10の質問(0-5スケール、0 = "not at all"、5 = "all the time"など)、それらを適切に処理できるように変換したいパラメトリックテスト用の間隔レベルデータ(正規分布、問題外のノンパラメトリックテスト)。

答えに非常に感謝します!


0〜5のスケールで6、7、8、9、10の値を設定するにはどうすればよいですか。
ttnphns

3
分かりやすいとはどういう意味ですか?カテゴリ変数をメートル法に変換することは簡単な作業ではありません。いくつかの潜在変数モデル(IRTモデルなど)があり、特定の仮定が成り立つ場合、それを可能にします。別の方法は最適なスケーリングです。しかし、このためには、Rを使用して、潜在変数モデルや非線形PCAなどの高度な統計を詳しく調べる必要があると思います。大丈夫ですか?
モモ

回答:


25

この応答では、測定の観点から考えられるモデルについて説明します。ここでは、一連の観測された(マニフェスト)相互に関係する変数、または測定値が与えられます。その共有分散は、明確に識別されているが直接観測できない構造を測定すると想定されています(一般的に、反射的に方法)、潜在変数と見なされます。潜在特性測定モデルに慣れていない場合は、次の2つの記事をお勧めします:心理測定学者の攻撃、 Denny Borsbooom、およびLatent Variable Modelling:A Survey、Anders SkrondalおよびSophia Rabe-Hesketh。複数の応答カテゴリを持つアイテムを処理する前に、まずバイナリインジケータを少し回避します。

順序レベルのデータを間隔スケールに変換する1つの方法は、ある種のアイテム応答モデルを使用することです。よく知られた例は、ラッシュモデルです。これは、従来のテスト理論から並列テストモデルの概念を拡張して、バイナリスコア項目に対処します。一般的な(ロジットリンクを使用した)混合効果線形モデル(一部の「最新」ソフトウェア実装)を通じて、特定のアイテムを支持する確率は「アイテムの難易度」と「人の能力」の関数です(存在しないと仮定)測定されている潜在特性の位置と同じロジットスケールのアイテムの位置との相互作用(追加のアイテム識別パラメーターを介して取得できます)、または個人固有の特性との相互作用は、差分アイテム機能と呼ばれます)。基礎となるコンストラクトは一次元であると想定されており、Raschモデルのロジックは、回答者が特定の「コンストラクトの量」を持っているだけである-被験者の責任(彼/彼女の「能力」)について話しましょう、θ、このコンストラクトを定義するアイテム(「難易度」)も同様です。興味深いのは、測定スケールθでの回答者の場所とアイテムの場所の違いですθです。具体例を挙げて、「不安以外に集中するのが難しいと思った」(はい/いいえ)という質問を考えてください。不安障害に苦しんでいる人は、一般の人々から採取されたうつ病または不安関連障害の過去の履歴がないランダムな個人と比較して、この質問に肯定的に答える可能が高くなります。

不安に関連する障害を評価する較正済みアイテムバンクを構築することを目的とする米国の大規模な研究から導出された29のアイテム応答曲線の図を以下に示します(1,2)。サンプルサイズはです。探索的因子分析により、スケールの単次元性(第1固有値が第2固有値(17倍)を大きく上回り、信頼性の低い第2因子軸(1を少し上回る固有値)が並列分析で確認された)が確認され、このスケールは信頼性を示していますクロンバッハのアルファ(α = 0.971、95%ブートストラップCI [ 0.967 ; 0.975 ]で評価される許容範囲内のインデックスN=766α=0.971[0.967;0.975])。最初に、各項目に対して5つの応答カテゴリ(1 = 'Never'、2 = 'Rarely'、3 = 'Sometimes'、4 = 'Often'、および5 = 'Always')が提案されました。ここでは、バイナリスコアの応答のみを検討します。

ここに画像の説明を入力してください
(ここでは、リッカートタイプのアイテムへのレスポンスはバイナリレスポンス(1/2 = 0、3-5 = 1)として記録されており、各アイテムは個人間で同等に差別的であるため、アイテムカーブの勾配(ラッシュモデル)。)

ご覧のとおり、xの右側にいる人バツ、潜在的な特性(不安)を反映軸のは、この特性をより多く表現すると考えられており、「私は恐怖を感じました」(恐ろしいと感じる) )または「突然パニックを感じました」(パニック)が左にいる人よりも多い(正常な人口、ケースとは考えられない)。一方、一般集団の誰かが眠りにつくのに苦労していると報告することはありそうもないことではありません:潜在特性の中間の範囲にいる人、たとえば0ロジット、スコア3以上の確率約0.5です(これはアイテムの難易度です)。

polytomousアイテム:注文したカテゴリを持つ、いくつかの選択肢がある部分信用モデル評価スケールモデル、または段階的応答モデル、名前を付けるが、ほとんどの応用研究に使用されていることをいくつか。最初の2つはIRTモデルのいわゆる「ラッシュファミリー」に属し、次の特性を共有します。(a)応答確率関数の単調性(項目/カテゴリー応答曲線)、(b)個々の合計スコアの十分性(潜在的パラメータは固定と見なされます)、(c)アイテムへの応答が潜在的な特性に依存する独立したものであることを意味するローカル独立性、および(d)差分アイテム機能の欠如 つまり、潜在的な特性を条件として、応答は外部の個人固有の変数(例:性別、年齢、民族、SES)に依存しません。

前の例を、5つの応答カテゴリが効果的に説明される場合に拡張すると、患者は、不安関連障害の前兆がない一般集団からサンプリングされた誰かと比較して、応答カテゴリ3から5を選択する可能性が高くなります。上記の二項項目のモデリングと比較して、これらのモデルは累積的(たとえば、3対2以下の回答の確率)または隣接カテゴリのしきい値(3対2の回答の確率)のいずれかを考慮します。カテゴリデータ分析(第12章)。前述のモデルの主な違いは、1つの応答カテゴリから別の応答カテゴリへの遷移の処理方法にあります。部分クレジットモデルは、特定のしきい値位置と潜在特性のしきい値位置の平均との差が等しい、または評価尺度モデルに反して、アイテム全体で均一です。これらのモデルのもう1つの微妙な違いは、一部のモデル(制約のない段階的応答モデルや部分的信用モデルなど)がアイテム間で不均等な識別パラメーターを許可することです。Reeve and Fayersによるアンケート項目とスケールプロパティを評価するための項目応答理論モデリングの適用、または項目応答理論の基礎を参照してください。 Frank B. Bakerによる参照してください。

前述のケースでは、二分法でスコア付けされたアイテムの応答確率曲線の解釈について説明したため、同じターゲットアイテムを強調して、段階的応答モデルから派生したアイテム応答曲線を見てみましょう。

ここに画像の説明を入力してください
(制約のない段階的応答モデル。アイテム間の不平等な差別化を可能にします。)

ここでは、次の観察結果を考慮する必要があります。

  • [2;2.5]睡眠が困難なが」)は、約 0.35から0.4; 「すごい」と、その確率は0.1未満から約0.25になります(青い破線)。不安の兆候を示している2人の患者を区別したい場合、後者の項目の方が有益です。
  • 睡眠障害は珍しくありませんが、睡眠の質を評価する項目とより深刻な状態を評価する項目の間には、左から右への全体的なシフトがあります。これは予想されていることです。結局のところ、一般集団の人々でさえ、健康状態に関係なく、眠りにつくのに苦労するかもしれません。しかし、「普通の人」(これが何らかの意味を持っている場合)は、パニック障害の兆候を示す可能性は低いです(彼らが最高の反応カテゴリーを選択する確率は、潜在範囲の中間範囲またはそれ以上に位置する人々に対してゼロです、[ 0; 1])。

θ

真の測定モデルと見なされることに加えて、Raschモデルを魅力的なものにしているのは、十分な統計量としての合計スコアを潜在スコアのサロゲートとして使用できることです。さらに、充足性プロパティは、モデル(人とアイテム)パラメーターの分離可能性を容易に暗示します(ポリトーマスアイテムの場合、アイテムの応答カテゴリのレベルですべてが適用されることを忘れてはなりません)。

R実装によるIRTモデル階層の適切なレビューは、Journal of Statistical SoftwareExtended Rasch Modeling:The eRm Package for the Application for Rで公開されているMairとHatzingerの記事で入手できます。他のモデルには、対数線形モデルモッケンモデルのようなノンパラメトリックモデル、またはグラフィカルモデルが含まれます。

Rとは別に、Excelの実装については知りませんが、このスレッドでいくつかの統計パッケージが提案されました。アイテム応答理論の適用を開始する方法と使用するソフトウェアは?

最後に、測定モデルに頼らずにアイテムのセットと応答変数の間の関係を調べたい場合、最適なスケーリングによる変数量子化の形式も興味深い場合があります。これらのスレッドで説明したR実装とは別に、SPSSソリューションも関連するスレッドで提案されました。

参照資料

  1. Pilkonis、P.、Choi、S.、Reise、S.、Stover、A.およびRiley、W. et al。(2011)。患者が報告するアウトカム測定情報システム(PROMIS)から感情的苦痛を測定するためのアイテムバンク:うつ病、不安、怒り評価、18(3)、263–283。
  2. チェ、S。、ギボンズ、L。およびクレーン、P。(2011)。lordif:反復ハイブリッド順序ロジスティック回帰/アイテム応答理論およびモンテカルロシミュレーションを使用して、差分アイテムの機能を検出するためのRパッケージJournal of Statistics Software、39(8)。

@Momoありがとう。好奇心が強いです。回答中(およびこの返信を今日再編集中)に、大きな+1の価値があるコメントに気付きませんでした。あなたが適切と思う場所で私の回答を編集してください。
-chl

3

Alan Agrestiは、著書 『序列カテゴリーデータの分析』でいくつかを取り上げています。そのうちの1つはリディットです。これについてはブログで説明します


1
これについてもう少し説明できますか?最初は、序数データを客観的に間隔データに変換することを主張する方法は魔法のように思えます。重要な何か。また、順序カテゴリ間の距離の先験的概念が必要になるようです-それはどこから来たのですか?
マクロ

公式はブログの投稿にあり、詳細な説明はAgrestiの本にありますが、基本的にはデータを使用して「平均累積比率」を作成し、スコアとして使用します。距離は、カテゴリー自体のどこかからではなく、各応答の比率から得られます。
ピーターフロム-モニカの復職

2
+1。リディットは、フラクションレス+(1/2)フラクションが等しいと簡単に説明できます。したがって、1、2、3、4、5が0.2、0.4、0.2、0.1、0.1の端数または確率を観測した場合、1のリディットは0.1です。2の値は0.4などです。リディットはカテゴリを対称的に扱い、結果として0か1を含む可能性が低いか小さいかよりも少なく、これはしばしば厄介です。
ニックコックス

名前ridit自体は、Brossによって面白く意図されていました(注:参照が必要です)。より良い名前は、中央分布関数(Parzen 1993)とグレード関数Haberman(1996)です。ハーバーマン、SJ1996。 高度な統計ボリュームI:人口の説明。ニューヨーク:スプリンガー。Parzen、E。1993。PPプロットと連続サンプルクォンタイル関数を変更します。統計におけるコミュニケーション-理論と方法 22:3287-3304。
ニックコックス

1
リディット自体は、通常またはガウスの分位関数などを介してプッシュできます。
ニックコックス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.