コンテキスト:
その間、2つの数値変数間の関連を効果的にプロットする方法に関する一連のヒューリスティックを取得しました。データを扱うほとんどの人が同様のルールを持っていると思います。
このようなルールの例は次のとおりです。
- 変数の1つが正に歪んでいる場合、その軸を対数目盛でプロットすることを検討してください。
- 多数のデータポイントがある場合(たとえば、n> 1000)、何らかの形式の部分透過性の使用やデータのサンプリングなど、別の戦略を採用します。
- 変数の1つが限られた数の離散カテゴリをとる場合、ジッターまたはヒマワリプロットの使用を検討してください。
- 3つ以上の変数がある場合、散布図行列の使用を検討してください。
- 何らかの形のトレンドラインを当てはめることはしばしば有用です。
- プロット文字のサイズをサンプルサイズに調整します(nが大きい場合は、より小さいプロット文字を使用します)。
- 等々。
質問:
おそらく例を挙げて、2つの数値変数間の関連性を効果的にプロットするためのこれらおよびその他のトリックを説明するWebページまたはサイトを生徒に紹介できるようにしたいと思います。
- インターネット上でこれをうまく機能させるページやサイトはありますか?