いくつかのEDAを実行しているときに、因子の2つのレベルの違いを示すために箱ひげ図を使用することにしました。
ggplotがボックスプロットをレンダリングする方法は満足のいくものでしたが、少し単純化されています(以下の最初のプロット)。ボックスプロットの特性を調査しながら、ノッチの実験を開始しました。
ノッチは中央値の周りにCIを表示し、2つのボックスのノッチが重ならない場合、95%の信頼レベルで「中央値が異なる」という「強力な証拠」があることを理解しています。
私の場合(2番目のプロット)、ノッチは有意に重なりません。しかし、なぜ右側のボックスの底が奇妙な形をしているのですか?
同じデータをバイオリンプロットにプロットしても、対応するバイオリンの確率密度に異常はありませんでした。
1
ggplotコードでは、現在amが数値変数として使用されているため、fill = factor(am)を使用する必要があります。
—
rnso
これは素晴らしい場所です@rnso
—
RDJ
誰でも元のデータを投稿できますか?の標準的なサンドボックスからのものだと思います
—
Nick Cox
ggplot2
。個々のデータポイントをプロットするアイデアも気に入っていますが、暗いボックス内のポイントが非表示になっている限り、それはイライラします。