ボックスプロットを解釈するには?


8

5つのカテゴリカル説明変数(concern, breath, weath, sleep, act)と1つの連続応答変数(tto)があるデータがいくつかあります。さらに、すべてのカテゴリー説明変数は5つのレベルに分割され、人がそれについてどれほど強いかを示します。レベル1とレベル5は、それぞれ完全な状態と最悪の状態を示します。

説明変数と応答変数の関係を確認するために、箱ひげ図を作成することをお勧めしました。プロットは以下のとおりです。しかし、箱ひげ図の読み方がわかりません。誰かが私がそれを解釈するのを手伝ってください。

ここに画像の説明を入力してください


2
あなたはおそらくウィキペディアの記事を読んだでしょう:en.wikipedia.org/wiki/Boxplotあなたが理解していないことをより明確に説明できますか?
ステファンコラサ2013年

はい、あります。だから私は基本的なスタッフを知っています。しかし、私はこの上でそれらを使用する方法を知りません。ここにはたくさんのプロットがあり、重要な数字を選ばなければなりません。たとえば、上記のすべてのカテゴリでは、レベル5のプロットが最も長くなります。どういう意味ですか?それはttoにどのような影響を与えますか?別の例は、なぜ多くのポイントがあるのでしょうか?私は、彼らが異常値を表す知っているが、これを拡張する方法がわからない
Günal

2
ボックスプロットから解釈できるものの制限をカバーする関連する質問:同一の5数の要約を持つ2つの分布は常に同じ形状になりますか?
Silverfish

回答:


10

箱ひげ図(または箱ひげ図)の解釈は、5つの数値の要約、つまり最小値、第1四分位数、中央値、第3四分位数、最大値のグラフ表示を提供するという理解に基づいています。ボックスには、観測値の50%が含まれています。ひげの端(ボックスの上部と下部から出る垂直線)は、通常、最小値と最大値の位置を示します。ただし、可能性のある外れ値が存在する場合(1.5四分位範囲に基づいて評価される場合があります)、図の場合と同様にポイントが追加されます。×

ボックスプロットの意味を理解するのに役立つため、データの特定のカテゴリのヒストグラムまたは密度プロットを確認すると役立つ場合があります。

@Glen_bは、左スキューが明白であり、第5レベルの感情の強さの中心傾向が他のものよりも低いことを正しく示しています。ただし、その差が統計的に有意であるかどうかを確認することは困難です。


8

そこにあるものの基本的な概要は次のとおりです。

  1. すべての分布は、1.0の上限に対して「詰まった」左スキューで表示され、多くの低い「外れ値」が下に向かって尾を引いています。
  2. 各プロットの5番目のカテゴリは、他のカテゴリよりも低い位置にあるようです。4番目のカテゴリも低い場合があります。
  3. 5つの変数すべて(懸念、呼吸、呼吸、睡眠、行動)は、広く類似したパターンを持っているようです。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.