平均と標準偏差のみを持つ結果のプロット


11

この平均の表とリコールスコアの標準偏差の観測値の適切なプロットを視覚化しようとしています。

ControlExperimentalMeanSDMeanSDRecall378216

それを行う最良の方法は何ですか?棒グラフはそれを行う良い方法ですか?その場合の標準偏差をどのように説明できますか?


11
データがない場合は、グラフを作成しません。それはスペースの無駄になります。
Roland、

4
これ以上ない場合、これらの手段とSDは多くの異なる分布と互換性があるため、完全な分析は困難です。
Nick Cox

回答:


9

棒グラフの標準偏差は、エラーバーを含めることで説明できます。

以下の可視化(source)は、そのような可視化の例です。

ここに画像の説明を入力してください


以下のコメントでの議論から、エラーバーのセットアップの代わりにエラーウィスカのみを使用することは、そのようなデータを視覚化するためのより良い方法のようです。したがって、グラフは次のようになります。

ここに画像の説明を入力してください


4
原則は明らかに正しい方向に沿っていますが、グラフを改善することをお勧めします。ビンが接触間隔用である場合、バーも接触する必要があり、ビンの境界を示すだけで十分です。それにも関わらず、クロスハッチングは、私の見解では、ここでは注意散漫にすぎません。ところで、観測されたカウントがゼロの場合のエラーをどのように示しますか?
Nick Cox

2
少なくともこの例では、両側にエラーバーがあり、最悪の「ダイナマイトプロット」にはエラーバーさえありません。1つの例については、こちらを参照してください。
Andy W

1
番号!バーをプロットせずにエラーウィスカをプロットすることを意味しました。バーは悪いです。
amoeba氏は、2015

3
この例のように、バーが小数の場合や、エラーバーを塞がない限り、他のいくつかの測定された数量でも自然原点と基準レベル0で問題がないと思います。しかし、値がゼロかどうかが問題ではない場合、バーはばかげて気が散ることがあります(悪いというよりは)。
Nick Cox、

2
もう1つの可能性は、クリーブランドのドットプロット(pdf)です。これは、水平方向に進むことを除いて、ドット&ウィスカバージョンと基本的に同じです。エラーバーはドットプロットではあまり一般的ではありませんが、許容範囲です。
ガン-モニカの復活

8

ドットプロットをお勧めします。

まだ改善の余地はありますが(おそらくデータを囲む大きな長方形のエッジを淡色表示にする)、ほとんどすべてのインクが情報の表示に使用されています。


1
これはOPの質問にどのように答えますか?平均と標準偏差でdotplotをどのように使用しますか?
kjetil b halvorsen 2015年

1
このスタックオーバーフローページでは、平均とSDからドットプロットを生成する方法について説明します
EdM、2015年

3
@kjetilbhavlorsen:平均はドットであり、標準偏差(またはオプションで、平均の標準誤差)は、ドットに隣接する線の長さを使用して表示されます。

3
(+1)「ドットプロット」という用語はかなり過負荷です。最初に考えたのは、各データポイント(もちろん、OPでは実行できず、生データがないため)にドットを描画することを提案することです。これは@kjetilも不思議に思ったことだと思います。このさまざまな「ドットプロット」には、「各データポイントのドット」タイプのプロットと区別するより具体的な名前がありますか?
Silverfish、2015年

0

おそらく、これらの種類の結果を生み出す種類のデータを視覚化する最良の方法は、数百または数千のデータポイントのデータセットをシミュレートすることです。 (実験的)には男性21と標準偏差6があります。シミュレーションは、スプレッドシートまたはお気に入りの統計パッケージで十分簡単です。次に、2つの分布をグラフ化して、2つのリコールスコアのセットが変化する程度の印象を得ることができます。

単純なExcelグラフ

シミュレーションデータセットを使用すると、ボックスプロットやエラーバー付きのヒストグラムなどの要約グラフを簡単に作成することもできます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.