どのような条件下でリッカート尺度を序数または間隔データとして使用する必要がありますか?


52

社会科学の多くの研究では、リッカート尺度を使用しています。リッカートデータを序数として使用するのが適切な場合と、間隔データとして使用するのが適切な場合


6
技術的には、リッカートスケールはリッカートタイプの項目の合計であるため、(少なくとも心理学の多くの心理学者によれば)間隔データポイントの合理的な近似値になります。
ラッセルピアス

2
@drknexus-それでは、複数のアイテムが構成スケールの測定三角測量として機能しますか?はいの場合、研究者がスケールを間隔測定として使用するのに十分な関連データポイント(つまりアイテム)を持っていると判断するための基準は何ですか?
ライオン

2
よく分かりません; それは一般的なコミュニティにとって価値のある質問かもしれません。それはおそらく研究者と分野の価値判断の一部であると思います。一部の地域では、明らかに序数であるにもかかわらず、1つのリッカートアイテムを間隔として完全に処理します。妥当な答えは、置換やブートストラップテストなど、別の分析方法を使用することです。別の答えは、正常性の単純なテストを実施することかもしれませんが、集約が正常性から大きく逸脱しない限り、おそらく大丈夫です。
ラッセルピアス

1
...しかし、一般的には、中心極限定理を呼び起こすことができ、20から30のアイテムで間隔測定としてスケールを使用するのに十分でなければならないように思われます。
ラッセルピアス

回答:


41

遅すぎるかもしれませんが、とにかく答えを追加します...

データをどのように処理するかによって異なります:参加者の異なるグループ(性別、国など)を検討するときにスコアが異なることを示すことに関心がある場合、スコアが通常の仮定を満たしていれば、数値として扱うことができます分散(または形状)とサンプルサイズについて。応答パターンがサブグループ間でどのように変化するかを強調することに興味がある場合は、一連の回答オプションの中から個別の選択肢として項目スコアを検討し、対数線形モデリング、順序ロジスティック回帰、項目応答モデルまたはその他の統計モデルを探す必要がありますこれにより、複数のアイテムに対応できます。

経験則として、一般に、スケールに11個の異なるポイントがあれば、インターバルスケールを近似するのに十分であると考えられます(解釈の目的については、@ xmjxのコメントを参照してください)。リッカートアイテムは真の順序スケールと見なされる場合がありますが、多くの場合、数値として使用され、平均値またはSDを計算できます。これは、態度調査でよく行われますが、たとえば2つの最も高いカテゴリで平均/ SDと回答の割合の両方を報告するのが賢明です。

合計スケールスコアを使用する場合(つまり、各項目のスコアを合計して「合計スコア」を計算する場合)、通常の統計が適用される場合がありますが、潜在変数で作業しているため、基になるコンストラクト理にかなっているはずです!心理測定では、通常、(1)尺度の単次元性が保持されていること、(2)尺度の信頼性が十分であることを確認します。このような2つのスケールスコア(2つの異なる機器)を比較する場合、古典的なピアソン相関係数の代わりに減衰相関測定の使用を検討することもできます。

古典的な教科書は次のとおり
です。1.毎年、JCとバーンスタイン、IH(1994)。心理測定理論(第3版)。心理学のマグロウヒルシリーズ。
2.ストライナー、DLおよびノー​​マン、GR(2008)。健康測定スケール。開発と使用の実用的なガイド(第4版)。オックスフォード。
3.ラオ、CRおよびシンハライ、S.、Eds。(2007)。統計ハンドブック、Vol。26:サイコメトリックス。Elsevier Science BV
4. Dunn、G.(2000)。精神医学の統計。ホダーアーノルド。

また、Rost&Langeheineの社会科学における潜在特性と潜在クラスモデルの応用、および人格研究に関する W. RevelleのWebサイトもご覧ください。

心理測定スケールを検証する場合、いわゆる天井/床効果(最低/最高の応答カテゴリで得点した参加者に起因する大きな非対称性)を調べることが重要です。これは、数値変数として扱うときに計算される統計に深刻な影響を与える可能性があります(例:国の集計、t検定)。態度や健康調査における全体的な反応分布は国ごとに異なることが知られているため、異文化間研究では特定の問題が生じます(例えば、中国人と西洋諸国から来る人は、特定の反応パターンを強調する傾向があり、前者は一般的に、項目レベルでのより極端なスコア。たとえば、Song、X.-Y.(2007)を参照してください。潜在変数および関連モデルのハンドブック、リー、S.-Y。(編集)、pp 279-302、北ホラント)。

より一般的には、測定の問題に関心がある場合は、リッカートアイテムを広範囲に使用する心理測定関連の文献をご覧ください。さまざまな統計モデルが開発されており、現在、アイテム応答理論のフレームワークの下で進められています。


2
明確にするために:Nunnally / Bernsteinは、少なくとも11の異なる値がある場合、変数を連続として扱うことを提案しています(p。115)。「12ポイントはインターバルスケールを意味する」という経験則はどこから来たのですか?
xmjx

12

簡単な答えは、リッカート尺度は常に序数であるということです。スケール上の位置間の間隔は単調ですが、数値的に均一な増分になるほど明確に定義されることはありません。

ただし、順序と間隔の区別は、実行される分析の特定の要求に基づいています。特別な状況では、インターバルスケールに収まったかのように応答を処理できる場合があります。これを行うには、通常、回答者はスケール応答の意味に関して密接に同意する必要があり、分析(または分析に基づいて行われた決定)は、発生する可能性のある問題に比較的敏感ではありません。


8
John Tukeyは、別の方法で(1960年に)モノグラフ「データ分析と行動科学」(Collected Works v。IIIに掲載)に書きました。彼が得た結果の1つは、約10%のテストと再テストの合意より良くなっている場合、スケールが十分に狭くないことです!
whuber

この答えは、リッカート尺度と元の評価項目を混同しているようです。@ russellpierceのコメントを参照してください。
rolando2

9

集計されたスケールについて上記で既に述べたことに加えて、グループレベルでデータを分析すると問題が変わる可能性があることにも言及します。たとえば、調べていた場合

  • 州または国の生活満足度、
  • 組織または部門の職務満足、
  • 科目における学生の満足度。

これらのすべての場合、各集計メジャー(おそらく平均)は多くの個々の応答(たとえば、n = 50、100、1000など)に基づいています。これらの場合、元のリッカートアイテムは、集計レベルで間隔スケールに似たプロパティを取り始めます。


-2

リッカート尺度は常に順序形式で:定量的価値を定性的データに帰し、統計分析を受け入れやすくする方法。潜在的な選択肢ごとに数値が割り当てられ、評価または調査の最後にすべての回答の平均値が計算されます。


5
当サイトへようこそ! 引用、または一般的に、他の人から借用している言葉を説明してください。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.