明確さを失う前に、いくつの変数をグラフィカルに表現できますか?


14

私が持っているこのグラフィカルな経済問題を正しく説明できるかどうか見てみましょう。私はこの分野に不慣れであり、これは純粋な好奇心であることに言及する価値があります。

グラフの通信品質が低下する前に、いくつの変数をグラフィカルに表現できますか?たとえば、私の聴衆が日曜日の新聞読者だとします。

次のセットがあるとします:体重(x)/年齢(y)、および2人の個人:ジェーン、10歳、30 kg; ジョー、20歳、60kg。グラフィック表示は次のようになります。

ここに画像の説明を入力してください ここに画像の説明を入力してください

これで、円のサイズを使用して別の変数を追加できることがわかったので、ジェーンとジョーが1週間に食べるハンバーガーの数(それぞれ10と20)の表現を追加したい場合、次のようになります。

ここに画像の説明を入力してください ここに画像の説明を入力してください

さらに、形状や色+サイズを使用して4つ目の変数を追加することもできます。たとえば、ビーフバーガーよりもチーズバーガーを多く食べる場合(ここでの制限は、バーガーのタイプが2つの値のみのブール値であるということです)

ここに画像の説明を入力してください ここに画像の説明を入力してください

そして、私はそれが乱雑になり始めると思います。5番目の変数を表すために形状をコンボに追加すると、グラフが「理解しやすく」なる危険があります。グラフを見ると、私の(特定の)脳はたぶん2つまたは3つの変数のみを処理し、それ以上は処理していません。たとえば、コンボを食べますか、それともハンバーガーだけを食べますか?:

ここに画像の説明を入力してください ここに画像の説明を入力してください

多分3次元を考えましたが、それはひどく見えるでしょう。私はこれについて完全に間違った方法で考えているかもしれませんが、ここでは把握できない非常に明白な何かを見逃している可能性があります(たとえば、3つまたは4つ以上の変数を表現しようとするのが練習として間違っている場合)私の質問へ:

  • 4(グラフが私のように非常に単純な場合は5 )は、2軸チャートで同時に表される最大変数の妥当な数ですか?

  • 明確さを失うことなく、より多くの変数を許可する他のグラフタイプはありますか?

  • 成功した多数の変数を表すチャートの良い例はありますか?

回答:


14

編集III:多変数定量データの視覚化の非常に豪華な例を見つけ、それを追加する必要がありました。「Edit III(ノーベル賞受賞者)」という見出しの下にあります。

編集II:少し誤解がありましたが、データの使用目的をどのように解釈するかを明確にするために編集しました。2つの画像を置き換え、「これでフライを食べますか?」というセクションを追加しました


グラフィックはデータを明らかにします。

エドワード・タフテ:

混乱と混乱は、情報の属性ではなく、設計の失敗です。クラッターは、コンテンツの削減ではなく、設計ソリューションを求めています。意味と推論は容赦なくコンテキストに基づいているため、かなり頻繁に、詳細がより強力になり、明快さと理解が深まります。少ないが退屈です。

なぜデータを視覚化するのですか?

  • 思考のためのツール
  • 激しいシーイングの結果を表示するには
  • 問題を理解し、決断を下す
  • 比較を表示、因果関係を表示
  • 信じる理由を提供する

どうやって?

  • データを表示する
  • 視聴者に方法論、グラフィックデザイン、グラフィック制作の技術などではなく、物質について考えるように誘導する
  • データの内容を歪めないでください
  • 小さなスペースで多くの数字を提示する
  • 大規模なデータセットを一貫性のあるものにする
  • さまざまなデータを比較するように目を促します
  • 大まかな概要から細かい構造まで、いくつかの詳細レベルでデータを明らかにします。
  • 説明、調査、集計、装飾など、合理的に明確な目的を果たします。
  • データセットの統計的および口頭での記述と密接に統合される。

いくつかの定義:

データ:

一般に「データベースでソートされるもの」と考えられています。これはもちろん数字、画像、音声、ビデオなどです。データは収集可能であり、多くの場合定量的です。その最も生の形では、消化するのは難しいです。桁の壁だけ。ええと; マトリックス。一般的に言って、我々は我々が行うすべてのもののために、ゼロからなる大規模なデータベースを持っていないではない、ほとんどのあるものです時々ものは、私たちが持っていない場合でも、持っている有益。持っていないものを見るには、持っているものを視覚化する必要があります。

情報:

データから抽出できるものです。何らかの方法でデータを表示することで、情報を収集できます。私がよく使用する例の1つは、世界の国のリストを提供し、2つが欠落していると言った場合、そのリストに基づいてそれらを見つけることはほとんどありません。ただし、地図上にあるすべての国を色分けして表示すると、中央アフリカ共和国とニューカレドニアが省略されていることがすぐにわかります。これは「ノイズを減らす」ことであり、可能な限り最も効果的な方法で物語を語っています。

インフォグラフィックとデータの視覚化:

私はあなたの例をインフォグラフィックと呼ぶのをためらいます。これは、データの視覚化、情報デザイン、または情報アーキテクチャの同義語と見なされることがよくありますが、私は同意しません。インフォグラフィックス-私にとって-一連のグラフ、図、イラストには、データの読み取り方法に関する偏ったステートメントが含まれている可能性があります。客観的ではなく、作成者の「関心」にないデータをスキップする傾向があります。あなたは誰かが事前に定義した結論に導かれます。エンターテインメントの価値があり、多くの場合、データから焦点を奪うイラストの圧倒的な使用があります。これは問題ありませんが、少し差別化すべきだと思います。

ビッグデータ:

ビッグデータは複雑なデータと同じではないことに注意してください。このLinkedInマップのように、多くのデータがまったく同じになる場合があります。コアデータは同じですが、(タグ付けによる)フィルターがあります。2つの変数があります。地理と、人々を職業/関心/関係に定義する何らかのタグです。異常な量のデータ。ただし、2つの変数のみです。

ここに画像の説明を入力してください

多変数:

以下は、データの多変数視覚化の例です。これは、チャールズミナードの1869年のチャートで、1812年のナポレオンのロシア軍の兵士の数、動き、そして帰路で遭遇した気温を示しています。 ビッグバージョンはこちら。 ここに画像の説明を入力してください

コードをクラックするのに少し時間がかかりますが、それを行うと素晴らしいです。対象となる変数は次のとおりです。

  • 軍隊の規模(ライブ/デッドの数)
  • 地理的位置
  • 方向(東-西)
  • 温度
  • 時間(日付)
  • 因果関係(戦闘および寒さで死亡)

これは、シンプルな2色のマップに含まれる驚くべき量の情報です。地理的な部分は他の変数に余裕を持たせるために様式化されていますが、それを取得するのに問題はありません。

ここに、よりトリッキーなものがあります。基本的な進化の視覚化、クラドグラム、系統発生学、生物地理学の原理に精通している場合、これは読みやすくなります。これに精通している人々のために作られていることを心に留めておいてください、それは専門家、科学的なチャートです。南アメリカの毒カエルの系統の系統地理的画像。左側のマップは、時間とともに変化する主要な生物地理学的領域を示し、右側の画像は、生物地理学的起源に関連したカエルの系統を示しています。(サントスJC、コロマLA、サマーズK、コールドウェルJP、リーR他[CC-BY-SA-2.5(www.creativecommons.org/licenses/by-sa/2.5)]、ウィキメディアコモンズ経由)。「コードをクラック」すると、驚くほど有益な情報が得られます。

ここに画像の説明を入力してください

小さな倍数、スパークライン:

これを十分に強調することはできません。繰り返し情報の価値を過小評価したり、別々の同一の視覚化に分割したりしないでください。あるグラフを別のグラフと比較するのがかなり簡単である限り、これはまったく問題ありません。私たちはパターン検出機です。これは多くの場合、小さな倍数と呼ばれます。これらの画像を非常に迅速に分析する問題はほとんどありません。また、すべてを1つの大きなグラフに詰め込むことは、10個の小さなグラフがさらに適切に機能する場合には無意味です。

ここに画像の説明を入力してください

別のもの:

ここに画像の説明を入力してください

そして、異なるが繰り返しグラフィックを使用するもの:

ここに画像の説明を入力してください

スパークラインは、Edward Tufteによって造られた用語であり、 完全に機能する、完全にカスタマイズ可能なjavascriptライブラリに発展しましたこれらは基本的に、「外部」オブジェクトとしてではなく、テキストの一部としてテキストに挿入できる小さなグラフです。デフォルトは次のようになります。 ここに画像の説明を入力してください

編集III(ノーベル賞受賞者)

私が見つけたこのデータの視覚化を追加する必要がありましたが、それは単にあまりにも優れています。ノーベル賞受賞者を示しています。大学、学部、科目、年、年齢、出身地、共有されたかどうか、学位レベル。確かに美しい証拠。これらはすべて定量化可能なデータです。詳細はこちら。

ここに画像の説明を入力してください

ここに画像の説明を入力してください

あなたのデータ

@Javiが提起する質問はすべて非常に重要です。

あなたがやろうとしているのは、思考のための視覚的なツールを作成することです。そのためには、最高の信号対雑音比を抽出する必要があります。苦労しているのは、さまざまな変数を持つデータ情報に関連付ける方法です。ここに質問があります。何がおおよそ正しい必要があり、何が正確に必要ですか?目的は何ですか?

バイアスをかけすぎずにデータを表示したいと考えています。相関関係がある場合は、読者自身に相関関係を見つけてもらいたいと思います。あなたの目的は、ハンバーガーが自分にとって悪いことや、女性が男性よりもハンバーガーの摂取量が少ないことを人々に伝えることではなく、それがデータに含まれている場合は「見える」ようにすることです(これらの3人が家族であるかどうかを想像してください。ハンバーガーを食べるグラフ全体の見方を少し変えてください)。

データセットは非常に小さいため、すべてをテーブルに入れるだけで十分です。しかし、もちろんこれは一般的なアイデアに関するものです。

少し詳細:時間 (年齢)は、左から右(タイムライン)に水平に見えるものである傾向があります。アップダウンのようなものに重みを付けるので、x-yを切り替えることをお勧めします。

1.一意の固定エンティティとは何ですか?

  • お名前

2.(eh ..)変数変数とは何ですか?

  • 重量(kg)
  • 年齢(年)
  • バーガーの数(整数)
  • ハンバーガーの種類(整数)

注:データは完全にユニットで構成されています。個別のメンタルスケールでそれぞれカウント、定量化できます。キロ、年齢、体重、数字。また、データベースと言えば、その名前がキーです。時空の可視化を開始し始めると、それは本当に頭痛の種になります。出身地、現在の家などを追加する必要があると想像してください。

ここから2つだけの相関はハンバーガーの数で、天気をかどうか、それはコンボがあります。他のすべての変数は独立しており、1つだけが固定されています(名前)。ある時点で、大きなデータセットでは、名前でさえ面白くなくなり、人口統計、年齢、性別などに置き換えられます。

この小さなデータセットを使用すると、次のようにすべてを1つのグラフで取得できます。 ここに画像の説明を入力してください

または、軸と名前バブルのコンテンツを変更することもできます。

個人的なメモ:xとyには人間の「物理的」特性が含まれているため、これは2つの方が優れていると思います。ここのバブル内の変数は、ハンバーガーの数です。

ここに画像の説明を入力してください

グラフに加えて円グラフを追加したり、円グラフのみを追加することもできます。個人的には、小さな倍数について述べたように、両方があります: ここに画像の説明を入力してください

あなたはそれでフライドポテトが欲しいですか?

私の推測では、ハンバーガーと食事の比率も知りたいと思っていました。すべての食事にはハンバーガーが含まれています。すべての食事が組み合わせであるわけではありません。

  1. 人が時々コンボミールを食べるかどうかだけを知りたいですか?
  2. それとも、ハンバーガーの食事のうち、いくつがコンボミールであるを知りたいですか?

1.の場合、name / key / idにブール値が適用されます。

ジェーンは時々コンボミールを食べますか?真/偽。

2.の場合、ブール値を食事に適用できます。

1チーズバーガー、combomeal = true

1チーズバーガー、combomeal = true

1チーズバーガー、comboreal = false

1チーズバーガー、comboreal = false

1チーズバーガー、comboreal = false

1チーズバーガー、comboreal = false

1チーズバーガー、comboreal = false

1ビーフバーガー、combomeal = true

1ビーフバーガー、combomeal = true

1ビーフバーガー、comomeal = false

これは非常に退屈なので、次のように分類できます。

ジェーンは10個のハンバーガーを食べます。これらのうち、3つはコンボです(「フライドポテトが必要ですか?」)。

組み合わせの1つは、ビーフバーガーメニューです。

組み合わせの2つはチーズバーガーメニューです。

残りはシングルバーガーです。5チーズ、2ビーフ。

この円グラフは、それを視覚化する試みでした。このバージョンでは、より明確にするためにパイスライスを保持しています。これに関することは、大きなデータセットと%の適用を開始することはまったくないということです。 ここに画像の説明を入力してください

しかし、最善の方法は考え直すことだと思います。

別の見方をすれば、本当に本当に簡単です。ここでは、どの年齢グループ、どの体重グループ、および「持っていない」すべてのデータわかります。持っているデータはスペース関連ではなく、単位のみです(kg、年、数字+キー/ ID /名前):

(編集:私の顔に卵:「すべての食事はハンバーガーであり、すべての食事がコンボではない」に関して、これらの画像をより正確なものに置き換えました)

ここに画像の説明を入力してください これは、より多くの人で簡単に拡張できます。

ここに画像の説明を入力してください または、10歳、20歳、30歳の年齢層を比較すると、統計の視覚化を非常に簡単に読むことができます。

ここに画像の説明を入力してください

..できるだけ明確にするため。この考え方の例を次に示します。このチャートは、タイタニックの生存者、乗組員、クラス、男性、女性の比率を示しています。 ここに画像の説明を入力してください

他にも多くのソリューションがありますが、これらはほんの一例です。

私は何度も続けることができましたが、今は自分自身とおそらく他のみんなを疲れさせています。

使用するツール:

ゲフィ

Gapminder Hans Roslingによるこの驚異的なTEDプレゼンテーションをご覧ください。

Googleチャート

ソンビス

ラファエル

MIT展示(以前はSimilieと呼ばれていました)

d3

ハイチャート

参考文献:

PJオノリ; ハードの防衛

エドワード・タフテ:美しい証拠

エドワード・タフテ:構想情報

エドワード・タフテ:定量的情報の視覚的表示

視覚的説明:画像と量、証拠と物語

男性、アラン、2007年理論と文脈の観点からの説明スイス、ローザンヌ。ニューヨーク、ニューヨーク:AVA Academia

アイルズ、C。&ロバーツ、R.、1997。可視光、芸術、科学、日常の写真と分類、近代美術館オックスフォード。

カード、SK、マッキンレイ、J。&シュナイダーマン、B。編、1999。

Grafton、A.&Rosenberg、D.、2010。時間の地図作成:タイムラインの歴史、プリンストン建築出版。

リマ、M.、2011。視覚的複雑性:情報のマッピングパターン、プリンストン建築出版。

Bounford、T.、2000。デジタルダイアグラム:統計情報を効果的に設計および表示する方法0 ed。、Watson-Guptill。

Steele、J.&Iliinsky、N. eds。、2010. Beautiful Visualization:Experts Eyes the Experts of Experts 1st ed。、O'Reilly Media。

Gleick、J.、2011年。情報:歴史、理論、洪水、パンテオン


全部読みましたが、吸収するには数週間かかります。本を書くべきです!
ジョシュアフランク14年

ノーベル賞のイメージについては、彼らがそれをどのように作ったか知っていますか?これらの流れるリボンは美しいです。
ジョシュアフランク14年

いいえ、私は彼女がそれを作ったかを正確に知りませんが、あなたは彼女の求めて単に試みることができるので、ジョルジアルピは、他のいくつかの質問に答える非常に迫ってきた giorgialupi.net
benteh

ねえ、いい考え。私は彼女にメールを送りました。
ジョシュアフランク14年

2
この回答に対して小説賞に値するn_n
ラファエル

5

視聴者にデータを表現するためのキーの検索を絞り込むことができるいくつかの追加の質問があると思います。履歴書を特定の仕事に絞るようなものだと思います。

  1. なぜインフォグラフィックを作成するのですか。
  2. 視聴者にデータについて知ってほしい最終的な目標または結果は何ですか。
  3. あなたの聴衆について何を知っていますか、そして彼らはどのようにデータに関係しますか。(年齢、性別、地理的位置、体重など)
  4. 表示する最も重要なデータと最も重要でないデータと、それらの違いは何ですか。
  5. 最初にデータを作成するための「ネット」目標を最もよく達成するために、データを表示するメディア/コンテキストは何ですか?たとえば、データまたは物理的なデジタル表示になります(対象読者が子供の場合、瓶に入ったジェリービーンズを考えてください)。オフィスでの会議ですか、それとも商業的なベンチャーですか?
  6. データを作成する目標の整合性を保ちながら、データをさまざまなインフォグラフに分割できますか。

データと目標によって、表示するものと表示しないものの条件を決定する必要があります。たとえば、火曜日の午後1時から午後3時の間、マクドナルドで人々が注文したもののグラフを表示することは、あなたの全体の目標が人々が一般的に注文したものの比較を示すことだけであった場合、どれほど重要でしょうか?時間変数は、生データを持っている場合でも必要ありません。それは私たちの目標ではありませんでした。

具体的に質問に答えるため。個人的にI(主観)あなたはこのような基本的なチャートにthree'ish / 4変数(大きさ、形、色、位置)を使用し過ぎて、リーダー(私は)退屈/失われたと退屈/失わ取得するときだと思うがそうであるではありませんグラフが作成された理由。しかし、彼らは完全に楽しく、本当に観客を引き付けることができます。例えば、のようなものこれは、ように対向これ。2番目の例の重要性も、一般的なデータを示すオフィスでの会議に参加した場合に非常に効果的なインフォグラフになるため、重要ではありません。これは、データを表示する媒体とコンテキストに関する質問に戻ります。

データに変数を表示する方法を探している場合は、インフォグラフィックを調査することをお勧めします。効果的なインフォグラフィックの作成に関するSmashing Magazineの優れた出発点を次に示します。これの一部は主観的であり、主観的であることに留意してください。


2

これは素晴らしい質問です。本当に。

上にあると考えの華麗なライン。

これについての議論が必要です。しかし、私はそれをわずかに異なって言います:

**

最新の実例となるテクノロジーやデザインと相互参照できるプロパティはいくつありますか?

**

答えは、制作の3つの側面にあります。それは、ディスプレイ、デザイン、プレゼンテーションモードです。これらはすべて、視聴者の考慮の波及によって融合され、考慮されています。

ディスプレイは物理的なものです。サイズ、解像度、色空間に制限があります。

デザインは無制限ですが、この質問の本当の興味深い側面です。現代の実例となる技術と、デザインと創造性の理解を最大限に活用する方法

プレゼンテーションモードは、静的、動的、またはインタラクティブです。それぞれに長所と短所があり、ディスプレイの媒体、種類、サイズによってさらに複雑になります。

そして、ハビが正しく指摘しているように、おそらく十分に近くに行かない...これはすべて主観的です!か否か。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.