散布図で連続値をジッターするのはなぜですか?


12

オレンジキャンバスを使用して、散布図を生成しました。連続変数をジッタする可能性はありますが、なぜそうするのか本当にわかりません。

ジッタリングの背後にある考え方は何ですか?


1
オーバープリントに対処して、誤解を招く視覚的印象を少なくするため。数点しか持っていないなら、それをする必要はありません。
mdewey 16

データのパターンを見やすくするジッタリングの具体例については、ここでの答えを参照してください:大きなN、離散データ、および多くの変数があるときに散布図行列から情報を抽出する方法は?
GUNG -復活モニカ

回答:


18

この投稿はそれをうまく説明しています。

多くの場合、重複するポイントが多数ある場合、それらの密度を把握するのは困難です。(1、1)の2000ポイントは、(1、1)の1ポイントと同じように見えます。ジッタを追加すると、重なり合うポイントがスミアに変わり、ポイントの密度がはっきりします。


それは離散データについてではありませんが、質問は連続データについて明示的に尋ねていますか?
アメーバは、モニカを

@amoebaが、この答えは正しいと言ったことに加えて、処理する連続データが測定精度のために丸められているため、上記のような問題が発生することを追加します。
ティム
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.