データの視覚化を行っています。各データムは正方形で表されます。基になるデータを直感的に読みやすくするために、各正方形の辺の長さまたは各正方形の面積は、それが表すデータに比例する必要がありますか?
データの視覚化を行っています。各データムは正方形で表されます。基になるデータを直感的に読みやすくするために、各正方形の辺の長さまたは各正方形の面積は、それが表すデータに比例する必要がありますか?
回答:
作成者であるあなたが不明な場合、読者はどのようにそれがわかるのでしょうか?
簡単な答え:値はページの色の量と1:1でリンクする必要があります。したがって、あなたの例では、エリアでなければなりません。しかし、それだけではありません。読者に誤って読ませるような誤解を招くような手がかりも避ける必要があります。長所ではなく面積(棒グラフなど)を使用している理由を知る必要があります。
まず、決して変数は片側だけの長さにリンクされている場合、実際に形状変化の長さと幅(すなわち面積)の両方を持っていません。Xが2倍Yであるが、Yがページ上で4倍の色を持っている場合、読者を誤解させています。この種のゆがみは「嘘の要因」と呼ばれることもあり、多くの場合、違いを誤解させ、誇張する意図的な試みであると想定されています。
対策として面積を使用する場合、強くお勧めします:
なぜareaを使用しているのかを知る。長さなどの長さの代わりに面積を使用すると、次のことができます。
正方形ではなく、中央揃えの領域に円を使用することを検討してください。
たとえば、上記では、「5」というラベルの付いた正方形が「10」というラベルの付いた正方形の高さの4分の3であると見にくいので、誤解を招く可能性があります。
サークルはこの種の比較を勧めません。それは、より直感的なレベルの「そのブロブは次のブロブよりもかなり大きい」ということです。
この種の直感的なエリアベースの比較はより魅力的であり、あまり関心のないオーディエンスへの参入障壁を下げることができるという、ユーザーテストから小規模研究までのさまざまな証拠があります数字の冷静な細目ではなく、主題に読者が集中できるようにします。しかし、これは、より数値志向の分析の邪魔になるという代償を伴います。
審美的な理由から、1次元(長さまたは距離)と2次元(領域)を選択しないでください。視聴者とメッセージに基づいて選択してください。
コミュニケーションに適しているのはどれですか:「はるかに大きい」レベルでの即時の腸内レベル比較、または「他のレベルの約80%である」レベルでの数値的比較の検討
または、エリアを使用する必要がある実用的な理由はありますか?
次に、実際的な理由で選択したら、美学を適用します。
私は地域を言うだろう。光学的には、辺の長さが2倍の正方形は、面積が4倍の大きさです。偶然の観察者は、あなたの伝説を読まなくても、その地域に関係します。
良い例は、xkcdのRandall Munroe によるこの伝説的なグラフです。
長さほど、面積の違いを判断するのは得意ではありません。長さをプロキシとして使用するため、エリアの違いを過小評価する傾向があります。
このため、実際に別の領域の2倍の面積を持つ円は小さすぎるように見えます。これは、脳が半径を関係付けているためです。
Rの比例シンボルマッピングなど、この現象を調整する興味深い試みがあります。これは、長さと面積を判断する方法により密接に整合するようにシンボルの知覚スケーリングを提案します。
これがこの論文の図2です
個人的にはこれについての経験はなく、定量的な判断が必要な場合は領域の使用を避けています。
興味深い接線は、ボリュームの知覚と長さの関係です。これらの認識方法の違いはさらに顕著です。これは星のサイズ比較のこのビデオで例証できます。
太陽の直径の約1,700倍である最大の星に着く頃には、1,700倍よりはるかに大きいという印象が残ります。
面積と長さの違いを認識する際のエラーをより体系的に見るには、「クラウドソーシンググラフィカルな認識:機械式タークを使用して視覚化デザインを評価する」をJeffrey HeerとMichael Bostockが参照してください。
私の意見では、エリア(D)ではなく、両側(E)です。
長さ2の辺を使用している場合、面積は値の4倍になり、非常に重なり合ったグラフになります。(E)
通常の棒グラフ(A)がある場合、データは線形であり、バーの幅は見た目だけのためです。(B)
これらの場合、バーの幅は同じであるため、エリアは再びデータを表します。3Dバーを持つことができますが、それでもバーのボリュームはデータを表すボリュームです(C)
Tufteはこれに広範囲に対処しました。見る:
グラフィカルな整合性のいくつかの原則:
- グラフ自体の表面で物理的に測定される数値の表現は、表現される数値に直接比例する必要があります
- 図のゆがみやあいまいさをなくすために、明確で詳細かつ完全なラベルを使用する必要があります。グラフ自体にデータの説明を書きます。データ内の重要なイベントにラベルを付けます。
- 設計のバリエーションではなく、データのバリエーションを表示します。
- お金の時系列表示では、貨幣測定の収縮および標準化された単位は、ほぼ常に名目単位よりも優れています。
- 描かれている情報(可変)次元の数は、データの次元の数を超えてはなりません。グラフィックスはデータをコンテキストから引用してはなりません。
あなたの場合、データが2Dまたは3Dの画像または線でより適切に表現されているかどうかを自問する必要があります。立方体、正方形、線は同じではありません。これが、3D棒グラフがしばしば誤解を招く理由の1つです。