プロットの設計と作成に不可欠なルールは何ですか?


19

バックグラウンド:

以前、クロス検証では、次の質問がありました。

それはによって示唆された@デビッドこの質問へのコメントは我々が持っている必要があることをコミュニティのwikiとの質問の回答ごとに可視化ルールをコミュニティは上の投票ができること。

質問

データのグラフィカル表現の設計と作成に関する基本的なルールは何ですか?

ルール

  • 回答ごとに1つのルール
  • 理想的な理由を簡単に説明してください。
  • 良いプラクティスと悪いプラクティスの例(コードと画像)を含む回答が望ましい。

回答:


13

Substance over Form:適切なプロット、スタイル、カラーリング、またはその他のグラフィカルパラメーターを選択して、グラフパッケージで許可されるものではなく、プロットに表示するものを表示します。


8
(+1)グラフ作成ソフトウェアによって作成された最小の抵抗の経路によって設計上の決定が導かれる可能性を減らすために、最初に紙にグラフをスケッチすることを好む。
ジェロミーアングリム

13

色の三次元に精通していると役立ちます。複数の色を使用する場合は、1つの色だけでなく、それらの次元のいくつかで理想的に異なる必要があります。

値。グラフは白黒でも読みやすくする必要があります。この単純なルールは、色覚異常、低品質のプリンター、悪い照明条件を考慮すべきです。異なる色相を使用する場合でも、値が十分に異なることを確認してください。特に、プロットは明るい背景(またはその反対)では暗いはずですが、グレー値ではグレーではありません。最悪の例は、赤の背景の青のプロットです。両方とも中間値です。つまり、白黒に変換した後、非常に類似したグレーが得られます。

飽和。彩度は適度に使用する必要があります:純粋な赤の線は問題ないかもしれませんが、太くて彩度の低い赤の線は読みやすくなります(太さが増すことで色が区別され、彩度を下げることができます)。一方、真っ赤な領域を見るのは苦痛です:領域を塗りつぶすのに飽和色を使用しないでください。ビールのカラーパレット (マップではなく、ラインプロットのために設計された)は、低彩度色の選択肢の例を与えます。最悪の例は、飽和した背景です(赤に青または青に赤)。

色合い。@gungで述べたように、赤/緑(交通信号灯)の組み合わせは避けてください。色覚異常の人は、あなたが思っているよりもずっと多くいます。特に色相では、少ないほど多くなります。たとえば、「発散」値(つまり、正または負の値)をプロットするには、2つの色相(正と負の値)のみを使用して、読者が高いものと低いものをすぐに区別できるようにします。離散勾配を使用すると、プロットがはるかに読みやすくなります。色の境界が表示され、等高線プロットが形成されます。

S. Fewのチャートでの色の使用に関する実用的なルールを読む か、アートやデザインの学生向けの「色彩理論」に関する資料を参照することをお勧めします 。


+1、素敵な情報はこちら。価値と、白黒への変換後に色がどのようにレンダリングされるかについてのあなたのポイントは特に良いです。いくつかの論文へのリンクも役立ちます。注:他の回答を「上」と呼ばないで、代わりに@ so-and-soを使用することをお勧めします。答えは投票数に基づいて動きます。
GUNG -復活モニカ

11

図自体の中に必要な情報をできるだけ多く入れます。読者がキャプションを参照する必要はありません。たとえば、さまざまな記号や色の意味を特定するために。キャプションの図自体には入らない情報(または補足情報)を配置します。 アイデアは、関連情報を抽出し、グラフ、視聴者が必要な作業量を最小限にすることです --bestを:グラフが次の最良の、自明である:必要な補足情報はすぐに、キャプションから収集最悪することができます。ビューアは密接て読まなければなりません何が起こっているかを理解するためにいくつかの重要な詳細を検索する結果セクション全体。


1
1、我々はさらに、この考え方を拡張することができます。私たちは、キャプションを読みすることなく、何が起こっているか、それは、そのような人々は(可能な限り)グラフとノウハウを見ることができるようにしたい、とも彼らはへの追加情報が必要なときキャプションで利用できるようにしておくと、人々はキャプションを読んで、その重要な詳細を探して論文を読み通さなくても必要なものを知ることができます。
GUNG -復活モニカ

1
@gungはこれがCWなので、コメントを反映するために回答を自由に編集してください。
デビッドルバウアー

10

プロットをできるだけシンプルにします。Tufteの言葉を借りれば、「データインク比を最小限に抑える」ことです。

たとえば、次のことは避けてください:

  • 必要以上の色や形
  • 必要以上の目盛り
  • 2次元プロットの3次元効果。
  • オブジェクトに直接ラベルを付けることができるときに凡例を使用する

ここでTufteに同意しません。最初に、彼のオリジナルの本のこのルールの動機の大きな部分は、余分な不要な線を描くのにどれだけの時間を費やすかです。しかし、これは今日は無関係です。第二に、実際のアイデアは、より多くのインクでプロットがより有益になることがあるため、グラフィックの有益性を最大化するためにクリーブランドのルールによってよりよく捕捉されますが、両方のルールはTufteを怒らせるチャートジャンクを禁止します。
GUNG -復活モニカ

@gungは、Tufteの動機として提示された努力/時間でした。私はこの部分を思い出しません(しかし、私はまた、便利なテキストを持っていません)。
デビッドルバウアー

1
どちらも持っていませんが、彼の1冊目のビジュアルディスプレイで、グラフを描くためにルーラーを何回置く必要があるかについて彼が話していたことを覚えています。たぶん「大きな」は誇張でしたが、私はこれを読んで、「今誰がそれを気にしているのか」と考えたことを覚えています。では要素、クリーブランドはタフティのルールが間違っていることを説得力の引数になります。彼はポイントが情報伝達を最大化することであると主張し、この原則はTufteが嫌いなものを排除するが、余分な非データインクがグラフをより有益にするケース(彼が示す)を可能にすることを示しています。
GUNG -復活モニカ

明確にする必要があります。具体的な提案のいくつかには同意しません(3Dなし、チャートジャンクなしなど)。グラフィックスのガイドラインとしてのTufteのルールにしています。
GUNG -復活モニカ

@gung私は同じ議論をヒューリスティックなツールとして解釈しました-読者がデザイナーの作業を減らす方法ではなく、アプローチを理解する簡単な方法です。
デビッドルバウアー


6

赤と緑に反対しないでください。 色は役立つ場合がありますが、色を使用するときは、かなりの少数の人々が赤緑の色盲であることを常に念頭に置いてください。私はかつて誰かにいくつかのデータを見せていましたが、彼は私のグラフで何が起こっているのかわかりませんでした-それは無駄であり、私はかなり愚かでした。色覚異常の他の形態は非常にまれですが、赤緑はかなり一般的です。 このページには多くの良い情報があります。ヒントを次に示します。

  • 2色しか必要ない場合は、青と黄色を使用します。赤と緑は使用しないでください。
  • グラデーションが必要な場合は、彩度と明度を同時に変更しながら青から黄色に移動します。虹は使用しないでください。
  • 3つ以上の要素(2つ以上のグループからの散布図上の点、または複数の線など)をエンコードする必要がある場合は、異なるプロット記号/線スタイルでも色をバックアップします。たとえば、個別のプロットシンボル:o + <sw、または線:実線、点線、破線、点線など(線にプロットシンボルを追加したり、線の太さを変更したりすることもできます)。

これは確かに私がかなり頻繁に疑問に思ったものです:使用するのに最適な色のグラデーションは何ですか?
ステフェン

4

積み上げ棒グラフを使用しないでください。また、関連する注意事項として、リッカートスケールアイテムがある場合、各アイテムへのすべての応答の割合を示す必要性を感じないでください。これらのグラフは私の目を出血させます。

円グラフを使用しないでください。

テーブルをスローすることにより、グラフに含まれるデータを複製しないでください。

グラフのタイトルなどには、Arialのようなサンセリフフォントを使用してください。これらの種類のフォントは、そのように使用するように設計されているためです。

設計に関する投稿は、本の参照なしでは完全ではありません。私は統計的経験則が本当に好きです。第9章は、ここでの議論に関連する部分であり、なぜ積み上げ棒グラフや円グラフが嫌いなのかと尋ねられたときに指摘する部分です。:)

告白:小規模なNGOクライアントの最初の学生相談役の1人で、多数の積み上げ棒グラフをカラーで印刷したレポートを提出しました(これは1990年代半ばでした)。私はそれらの子犬になんとか黄色、紫、赤を入れることができたと思います。


3

軸を混乱させないでください。グラフの勾配がより印象的に見えるという理由だけで、最初の100単位を切り捨てないでください。画像はくっつき、人々は実際に測定されたよりもはるかに大きな効果を覚えています。


2
見かけの勾配を変更するためにデータを切断することは不正です。OTOH、軸に常に0を含めるべきかどうか、および(やや関連性が低い)使用するアスペクト比について、本当の疑問があります。クリーブランドは、データウィンドウ内のデータを最大化し、「バンク」の傾斜を45度にすると、グラフがより有益であると強く主張しています。ここであなたの聴衆を知ってください:クリーブランドは、プロの聴衆は有能で識字があると見なされるべきだと主張しますが、素朴な聴衆では、これらの機能を明示的に指摘して説明するか、(おそらく)使用しないでください。
GUNG -復活モニカ

プロの聴衆でさえ、数か月後にはグラフの急な線しか覚えておらず、インターセプトやその他すべてを忘れてしまうでしょう。極端な値を正しくラベル付けすることで、(フラットな)グラフにすべてのデータを保持でき、実際には何も変更されていないという情報を保持できます。
-xmjx

2
同意しません。それが提案されているものである場合、すべての軸がゼロから始まると主張することは賢明なルールではないと思います。グラフィックスはデータの変動と構造を示す必要があります-重要なのが200万の値の周りの100,000の変動(そしておそらく2つのグループ間での違い)である場合、グラフィックスは「200万が大きい「。
ピーターエリス

基本的にすべてのデザインルールと同様に、プロットされたバリエーションの実際的な重要性と視聴者がそれをどのように解釈するかを本当に理解していれば、これは破ることができるものだと思います。しかし、この規則は非常に頻繁に違反されるため、「すべてのプロットにはゼロを含める必要があります!」と大声で宣言するのは比較的安全だと思います。実際、最大の広がりが約5%である過去20年間に渡って乱暴に。
マットパーカー

5%が無意味であるというわけではありません-そして、それらのプロットのほとんどは、その変動を生成したポリシーの結果に関する議論に関連付けられています。しかし、大きな経済的影響を伴う大規模な政策が実際に住宅所有に与える影響が比較的小さいことを強調すれば、これらの議論はさらに強力になると思います。
マットパーカー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.