多くの場所で、順序変数の平均を計算することは不適切であると読んでいます。なぜそれが不適切なのか、直観を得ようとしています。一般に、順序変数は正規分布していないため、平均を計算すると不正確な表現になるためだと思います。順序変数の平均を計算するのが不適切である理由について、より詳細な理由を誰かに教えてもらえますか?
多くの場所で、順序変数の平均を計算することは不適切であると読んでいます。なぜそれが不適切なのか、直観を得ようとしています。一般に、順序変数は正規分布していないため、平均を計算すると不正確な表現になるためだと思います。順序変数の平均を計算するのが不適切である理由について、より詳細な理由を誰かに教えてもらえますか?
回答:
簡単な答えは、これは論争的だということです。あなたが言及したアドバイスとは反対に、多くの分野の人々は順序尺度を利用しており、それは彼らが望むことを行うことを意味していることがよくあります。多くの教育システムでの成績の平均または同等のものがその一例です。
ただし、平均データは正規分布ではないため、有効な理由ではありません。
非正規分布に広く使用されています
いくつかの病理学的な場合を除き、非常に多くの非正規分布に対して数学的に明確に定義されています。
データが明らかに正規分布していない場合、実際に平均を使用することは良い考えではないかもしれませんが、それは異なります。
順序データで平均を使用しない強力な理由は、その値がコーディングの規則に依存することです。通常、1、2、3、4などの数値コードは、単純化または利便性のために選択されますが、関係する定義済みの順序に対応する限り、原則として同様に1、23、456、7890になります。どちらの場合でも平均を取るには、それらの規則を文字通りに取る必要があります(つまり、あたかも数字がarbitrary意的ではないが正当であるかのように)。手段を取ることを正当化するために、値の間の等しい差を文字通りに取ることができる間隔スケールが必要です。私が主な議論になると思いますが、すでに指摘したように、人々はしばしばそれを無視し、意図的に無視します。
追加の例を次に示します。多くの場合、人々は「強く同意しない」...「強く同意する」のいずれかを選択するように求められ、(ソフトウェアが何を望んでいるかによって部分的に)1。順序付けられた要素(またはソフトウェアが使用する用語)。ここでは、コーディングはarbitrary意的であり、質問に答える人々から隠されています。
しかし、多くの場合、人々は(たとえば)1から5のスケールで質問されます。例は豊富です:ウェブサイト、スポーツ、他の種類の競技会、そして実際に教育。ここでは、人々に目盛りが表示され、それを使用するように求められています。非整数は理にかなっていることが広く理解されていますが、慣例として整数を使用することは許可されています。これは順序尺度ですか?イエスと言う人もいればノーと言う人もいます。それ以外の場合、問題の一部は、序数スケール自体があいまいなまたは議論された領域であることです。
学業の成績、たとえばEからAをもう一度考えてみてください。多くの場合、このような成績は1から5のように数値的に扱われます。数値スコアへのマッピングは順序を保持する限り任意ですが、受け入れられることは事実ですが、実際には、評点の割り当てと受信を行う人々は、スコアに同等の数値があり、評点が平均化されることを知っています。
手段を使用する実際的な理由の1つは、中央値とモードがデータ内の情報の不十分な要約であることが多いことです。強く同意するものから強く同意するものまでスケールがあり、便宜上1〜5のポイントをコーディングするとします。1、1、2、2、2と1、2、2、4、5のコードがあります。中央値とモードが唯一の正当な要約であると思われる場合、それは順序尺度であるため、あなたの手です。ここで、平均が適切に定義されているかどうかなどに関係なく、平均が有用であるとわかった場合に手を挙げてください。
当然、コードが1から5の正方形または立方体である場合、平均は過敏な要約になり、それはあなたが望むものではないかもしれません。(目的がハイフライヤーをすばやく特定することである場合、それはまさにあなたが望むものかもしれません!)しかし、実際には非常によく機能するため、連続した整数コードを使用する従来のコーディングが実際的な選択である理由です。これは、測定理論家に重みを与える議論ではありませんし、そうすべきではありませんが、データ分析者は情報豊富な要約を作成することに関心を持つべきです。
評定頻度の分布全体を使用しますが、それは問題のポイントではありません。
順序値を使用するとします。たとえば、1は強く反対、2は反対、3は同意、4は強く同意します。4人の回答が1、2、3、4の場合、どういう意味でしょうか?(1 + 2 + 3 + 4)/4=2.50です。
4人の平均応答が「同意しない」または「同意しない」場合、どのように解釈する必要がありますか?そのため、順序データに平均を使用しないでください。
@Azeemに完全に同意します。しかし、このポイントを家に戻すために、もう少し詳しく説明します。
@Azeemの例のように、スケールが1から4の範囲の順序データがあるとします。また、このスケールで何か(アイスクリームなど)を評価する数人のユーザーがあるとします。次の結果が得られると想像してください。
結果を解釈する場合、次の範囲で何かを結論付けることができます。
ただし、評価の間隔については何も知りません。1と2の違いは3と4の違いと同じですか?4という評価は、その人が1と評価する人よりも4倍アイスクリームが好きだということですか?など...算術平均を計算するとき、それらの差が等しいかのように数値を扱います。しかし、それは順序データに関する非常に強力な仮定であり、それを正当化する必要があります。