ヴァイオリンプロットの解釈


9

私はヴァイオリンプロットを使用してさまざまなグループの分布を比較していますが、私が見つけたオンラインリソースのほとんどは、プロットの作成方法と結果の非常に基本的な解釈(中央値の変動、データがクラスター化されているかどうか)にのみ関連しています。

バイオリンのプロットを正しく解釈するためのガイドラインとして従うことができる詳細な例を探しています。

回答:


9

バイオリンプロットは、単なるヒストグラム(または、多くの場合、カーネル密度のような平滑化されたバリアント)を横向きにしてミラーリングしたものです。ヒストグラムの解釈方法を教えている教科書は、あなたが求める直感を与えるはずです。 Nick Coxの提案に従って編集: Freedman、Pisani、Purves、Statisticsはヒストグラムをカバーしています。

より正式な方法でそれらを解釈する限り、分布をグラフ化する全体のポイントは、統計的検定がだまされるかもしれないものを見ることです。

ヴァイオリンプロットで私がやりたいことの1つは、中央値、平均値などの線を追加することです。時々、箱ひげ図を重ね合わせて、要約統計の方法でさらに確認できるようにします。

少なくとも、最初の数瞬間の総偏差(平均、分散、歪度、尖度)だけでなく、二峰性や外れ値も見つけることができるはずです。


2
+1、同様のプロットは人口ピラミッドであり、反映された分布は単なる異なるカテゴリです(kdeではなく、より一般的なヒストグラムタイプの推定量を使用します)。
アンディW

1
Tukey、Exploratory data analysis、Cleveland、Elements of graphing dataのいずれも、ヒストグラムについてはあまり触れていません。どちらも、他の表現に関心があり、印象的です。それらはここでほのめかされている本ですか?基本的にヒストグラムをカバーする1つの本は、Freedman、Pisani、Purves、Statisticsです。
Nick Cox

1
実際、クリーブランドヒストグラムについて何か言ってます。彼は、それらは貧弱なグラフであり、彼の本では使用されないと述べています。:-)。そして、F、P、Pは素晴らしい本です。
ピーターフロム-モニカの回復

1
私はFPPから教えてきました。彼らは多変量回帰を明示的に行わないため、OLSを明示的に使用して長方形の面積を予測しません。ただし、この精神にはいくつかの例があります。たとえば、ガリレオがオブジェクトが高さhから落下するのにかかる時間tを線形回帰によって予測しようとした場合はどうなりますか?あなたは素晴らしい最小二乗法に適合しますが、もちろん真実は -ストーリーの教訓は、常に残差を見ることです。t=ch
Michael Lugo

1
@TrevorAlexanderそれは良い質問です。ミラーリングした方が解釈が優れていることを示す文献はありませんが、少なくとも私の目では、垂直方向のヒストグラムよりも見栄えがよくなっています。
アリB.フリードマン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.