5ポイントのリッカートアイテムの経時変化の統計的有意性


9

環境:

2年間にわたって実行された同じアンケートからの2つのデータセットがあります。各質問は、5-Likertスケールを使用して測定されます。

Q1:コーディングスキーム

現時点では、[0、1]間隔で応答をコード化しています。0は「最も否定的な応答」を意味し、1は「最も肯定的な応答」を意味し、その他の応答は等間隔です。

  • リッカート尺度に使用する「最良の」コーディングスキームは何ですか?

これは少し主観的かもしれないと思います。

Q2:年間の重要性

  • 2年間で統計的に有意な変化があるかどうかを判断する最良の方法は何ですか?

つまり、質問1の結果を毎年見て、2011年の結果と2010年の結果の差が統計的に有意であるかどうかはどうすればわかりますか。ここでスチューデントのt検定が使用されているという漠然とした記憶がありますが、よくわかりません。

回答:


7

1.コーディングスキーム

t検定を使用して統計的有意性を評価するという点では、重要なのはスケールポイント間の相対距離です。したがって、(0、0.25、0.5、0.75、1)は(1、2、3、4、5)と同等です。私の経験から、前述のような等距離コーディングスキームが最も一般的であり、リッカートアイテムには妥当なようです。最適なスケーリングを検討すると、別のコーディングスキームを導出できる場合があります。

2.統計検定

リッカートアイテムのグループの違いを評価する方法についての質問は、ここで既に回答されています

最初の問題は、2つの時点で観測をリンクできるかどうかです。別のサンプルがあるようですね。これはいくつかのオプションにつながります:

  • 独立したグループのt検定:これは簡単なオプションです。また、グループ平均の違いをテストします。純粋主義者は、p値が完全に正確ではない可能性があると主張します。ただし、目的によっては、それで十分な場合があります。
  • グループ平均の差のブートストラップテストグループ平均間の差をテストしたいが、従属変数の離散的な性質に不快な場合は、ブートストラップを使用して信頼区間を生成し、そこからグループ平均の変化に関する推論を引き出すことができます。 。
  • マンホイットニーU検定(他のノンパラメトリック検定の中でも特に):このような検定は正規性を仮定していませんが、別の仮説も検定しています。

つまり、一言で言えば、私が提案したもの(等距離コーディング、t検定有意性検定)には何も問題はありません。
Mac

@Mac私の意見では、適用された観点から見ると、それは単純で、理解しやすく、伝達しやすく、一般に合理的なアプローチです。ただし、個々のアイテムではなく、スケールを使用して対象の構成要素を測定することを検討することはしばしば価値があります。
Jeromy Anglim 2011

同意した。しかし、私はこれが何をする必要があるのか​​を信じています。どうもありがとう!
Mac

t検定は分散の違いに非常に敏感なので、最終的な決定を行う前に確認する必要があることに
注意し

@Mac / cc @richiemorrisroe私の考えでは、等分散性の仮定(これはウェルチのt検定である程度回避されます)を除いて、問題は主に非対称応答分布(天井または床効果)にあり、リッカートアイテムを使用するときによく発生します。
ch

3

序数データの場合、ウィルコクソンランクサムテスト(別名マンホイットニー)が適しています。ブートストラップソリューションは、「古典的な」方法ではありませんが、エレガントでもあります。因子分析などの他のことを目的としている場合は、ブートストラップ法も役立ちます。回帰分析の場合、モデル仕様として順序付きプロビットまたは順序付きロジットを選択できます。

ところで:スケールの範囲が大きい場合(変数あたりの値が10より大きい場合)、結果を指標変数として使用できます。これにより、t検定が安全な選択になります。これは少し汚れており、悪魔の作品と見なされる可能性があることに注意してください。

ステファン


1
ブートストラップが因子分析のためのより興味深いアプローチをどのように提供するかを拡張できますか?
2011

ここでマンホイットニー検定がt検定よりも好まれる理由について詳しく知りたいと思います。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.