グラフのフォーマット:折れ線グラフの下に塗りつぶしを使用するのが適切な場合


12

これはデータの視覚化に関する質問です。ここで質問してもかまいません。

下のグラフのように、時系列の折れ線グラフの下に塗りつぶしを使用するのが適切なのはいつですか?(1日のping時間を示しています)

下に塗りつぶしの折れ線グラフ

下に塗りつぶしのない普通の線を使用する方が一般的だと思いますが、視覚的な多様性のために塗りつぶしを使用しても大丈夫ですか?

私は、トピックに関する知覚的研究、またはスタイルガイドについて知ることに特に興味があります。


1
Ifは0sバインドされた自然の下で、あなたがそれを示して、なぜありませんか?
ttnphns 14年

1
別の方法で尋ねる-必要ない場合にフィルを使用する理由 別のトレンドラインを追加すると、物事が不必要に複雑になると想像してください。また、Y軸の単位とスケールを分離します。
マーティン14年

回答:


11

グラフィックの美的側面と有益な側面のバランスを取るには、少し芸術があります。Edward TufteやStephen Fewのような著名な視覚化コンサルタント/著者は、グラフの有益な部分から注意をそらすことのない最小限の美学を選択します。ただし、一部の聴衆にとっては、少量の繁栄が正当化されます。たとえば、Alberto Cairoのジャーナリスティックなデータ視覚化アプリケーションを参照してください。

知覚的研究の角度は、すべてのグラフィック要素がメッセージを伝達することであり、視覚皮質がそれを処理するために意識的に認識されないものもあります(「事前注意処理」)。余分な要素は、冗長な要素であっても、余分な処理が発生する可能性があります。適切なグラフは、伝達されるメッセージと対象者によって異なります。

特定の質問に対して、接続線はトレンド(およびトレンドからの変動)を強調します。塗りつぶされた領域は、ベースラインからの偏差を強調します。棒グラフまたは針グラフは、ベースラインから逸脱する個別のイベントを強調します。

グラフィックのコンテキストも重要です。密集したグラフのグリッドがある場合、塗りつぶしは各ラインをそのベースラインに関連付けるのに役立ちます。

最後に、冗長なグラフィック要素/装飾を追加するためのもう1つの考慮事項は、より有益な要素でグラフを拡張することを難しくすることです。たとえば、次のモックアップのように、特別な値を強調表示したり、他のトレンドラインをオーバーレイしたり、バンドをオーバーレイしたりできます。

ここに画像の説明を入力してください


1
私はこれに賛同する。グラフが雑誌/本の表紙であるためにカラフルである必要がない限り(およびマーケティング担当者が色を付けたい場合)、色を使用して通知する必要があります。グラフが「退屈」に見える場合、原因は、基になる情報がまったく面白くないか、折れ線グラフ形式では面白くないという事実です。このような場合、円グラフ、レーダープロット、または他の何かに役立つ可能性があります。
ロシナンテ14年

1
円グラフを使用しないことをお勧めします。高さの違いよりも弧の長さとくさびの面積の違いを認識するのは難しいです。信じられない場合は、32:34:33の比率の円グラフを同じ棒グラフと比較してください。どちらが読みやすいですか?
シャドウトーカー14年

2
私は一般的な言葉で話していましたが、特に上記のグラフのためではありませんでした。各チャートタイプにはメリットがあります。特定のチャートタイプは、すべての状況に適しているわけではありません。
Rocinanteの

4

考慮すべきもう2つのポイント:

コメントで述べたように、アンダーフィルは、x軸が自然なyゼロ点にない場合、ほとんど不適切です。これは、y軸がゼロ以外の数から始まるようにスケーリングされているか、使用されている単位に自然なゼロ解釈がないためです(たとえば、ケルビンには自然ゼロがありますが、摂氏にはありません)。

第二に、アンダーフィルが特に有効なのは、データ自体がアンダーフィルと見なされる場合です。たとえば、山の高さの折れ線グラフは、塗りつぶされていないことが理にかなっており、塗りつぶしの色は地球を表し、塗りつぶされていないのは空気を表します。

関連する例として、カウントデータがあります。各xポイントにすべての個体を積み重ねると、棒グラフが表示されます。バー間の補間が理にかなっている場合、アンダーフィルのある折れ線グラフになります。

「定量的情報の視覚的表示」からのこの画像は、それをもう少し良く説明するかもしれません。これは、第二次戦争中にどの軍事ユニットがヨーロッパにいたかを示しています(私は思う)。各時点でユニットを積み重ねると、塗りつぶされていない棒グラフが表示されます。データの上に線を引くと、塗りつぶされた線グラフが表示されます。


2
... 軍部隊は第一次世界大戦中にヨーロッパにいました(1917年と1918年の日付が物語を語っています)。
ニックコックス14年

@nickCoxもちろん。なぜ私はそれを見なかったのか分かりません。
timcdlucas 14年

4

前の2つの答えは主要な重要なポイントをカバーしていますが、まだ言及されるべきいくつかの事柄があります。

最初に、グラフ作成に対する極端なミニマリストのアプローチに同意しないと言う必要があります。すべての余分なインクを使用する必要があります。気を散らす、意味のないバリエーションは行ってください。しかし、単一の線よりもしっかりした領域のほうが目を引き、一目でより多くの情報を伝えることができます。そしてあなたが言うように、それは「視覚的多様性」を追加できます。

ただし、@ xanが指摘しているように、その一見は部分的に潜在意識のように、線とは異なる領域を解釈します。

面積グラフは、x軸に沿って進むにつれて累積される合計量を意味します。2つのグラフを比較し、1つのグラフの面積を大きくすると、開始値と終了値に関係なく、グラフの合計が大きくなっていることが一目でわかります。

対照的に、折れ線グラフは変化する値を示します。焦点は、累積された合計ではなく、あるポイントから次のポイントへの位置の変化にあります。

それでは、面積グラフをいつ使用する必要がありますか?

  • 値が明確な量を表し、明確なゼロ点がグラフに表示されている場合。
  • 値が、通常の1日の降雨量または1か月の利益/損失など、各ポイントで追加(または削除)される量を表す場合。
  • 値が母集団の分布を表す場合、曲線の下の合計面積はサンプルの合計サイズを表します。たとえば、異なる学年の生徒数のベル曲線(基本的には平滑化されたヒストグラム)。

グラフを読むときに、x軸上の2点を取ると、それらの間に表示される領域は、その範囲に蓄積する実際の量を表す必要があるという考え方です。このため、値に負の量が含まれる場合、負の領域と正の領域に反対の色を使用して、合計で相殺されることを強調することをお勧めします。

面グラフを使用すべきでない場合

  • ゼロ点が任意の場合(@timcdlucasが述べたように、非絶対温度の場合のように)、無効(為替レートなどの2つの値の比率である測定の場合)、またはスペース上の理由でグラフに表示されない場合;
  • 線の高さで示される値が、現在までの総降雨量(月/年)または負債/貯蓄などの累積測定値をすでに表している場合;
  • 値が累積ではなく、単一の変化するエンティティの位置/値を表す場合;
  • 同じチャート上の複数の線を比較する場合(エリア全体が表示されない場合、意味が失われます-代わりにエリアチャートを並べて比較します)。

これらのガイドラインを念頭に置いて、pingグラフは2つの方法で解釈できます。

一方では、ping速度を1日の間に変化する単一の変数と考える場合、単純な折れ線グラフが最適です。

一方、2つの異なるネットワークの毎日のping速度パターン(または異なる日/時間帯の同じネットワーク)を比較する場合は、合計を強調したい場合がありますいる場合、ネットワークタスクに必要な時間場合があります。たとえば、グラフに1つだけではなく複数のピークがある場合、線グラフは速度のばらつきを強調し、面積グラフは合計遅延を強調します。

比較する:
折れ線グラフ 塗りつぶされた領域を持つ同じグラフ
ピークが右側でより高い最大値に達した場合でも、グラフの前半(赤い線の左側)の累積合計は後半よりわずかに大きくなります。塗りつぶすと、左側の実線のブロックが強調され、ピークとのバランスがよくなります。

(画像の質の低さを容認してください-Rに面積グラフを作成する方法を理解できませんでした!個別にエクスポートおよび編集する必要がありました。)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.