編集III:多変数定量データの視覚化の非常に豪華な例を見つけ、それを追加する必要がありました。「Edit III(ノーベル賞受賞者)」という見出しの下にあります。
編集II:少し誤解がありましたが、データの使用目的をどのように解釈するかを明確にするために編集しました。2つの画像を置き換え、「これでフライを食べますか?」というセクションを追加しました。
グラフィックはデータを明らかにします。
エドワード・タフテ:
混乱と混乱は、情報の属性ではなく、設計の失敗です。クラッターは、コンテンツの削減ではなく、設計ソリューションを求めています。意味と推論は容赦なくコンテキストに基づいているため、かなり頻繁に、詳細がより強力になり、明快さと理解が深まります。少ないが退屈です。
なぜデータを視覚化するのですか?
- 思考のためのツール
- 激しいシーイングの結果を表示するには
- 問題を理解し、決断を下す
- 比較を表示、因果関係を表示
- 信じる理由を提供する
どうやって?
- データを表示する
- 視聴者に方法論、グラフィックデザイン、グラフィック制作の技術などではなく、物質について考えるように誘導する
- データの内容を歪めないでください
- 小さなスペースで多くの数字を提示する
- 大規模なデータセットを一貫性のあるものにする
- さまざまなデータを比較するように目を促します
- 大まかな概要から細かい構造まで、いくつかの詳細レベルでデータを明らかにします。
- 説明、調査、集計、装飾など、合理的に明確な目的を果たします。
- データセットの統計的および口頭での記述と密接に統合される。
いくつかの定義:
データ:
一般に「データベースでソートされるもの」と考えられています。これはもちろん数字、画像、音声、ビデオなどです。データは収集可能であり、多くの場合定量的です。その最も生の形では、消化するのは難しいです。桁の壁だけ。ええと; マトリックス。一般的に言って、我々は我々が行うすべてのもののために、ゼロからなる大規模なデータベースを持っていないではない、ほとんどのあるものです時々ものは、私たちが持っていない場合でも、持っている有益。持っていないものを見るには、持っているものを視覚化する必要があります。
情報:
データから抽出できるものです。何らかの方法でデータを表示することで、情報を収集できます。私がよく使用する例の1つは、世界の国のリストを提供し、2つが欠落していると言った場合、そのリストに基づいてそれらを見つけることはほとんどありません。ただし、地図上にあるすべての国を色分けして表示すると、中央アフリカ共和国とニューカレドニアが省略されていることがすぐにわかります。これは「ノイズを減らす」ことであり、可能な限り最も効果的な方法で物語を語っています。
インフォグラフィックとデータの視覚化:
私はあなたの例をインフォグラフィックと呼ぶのをためらいます。これは、データの視覚化、情報デザイン、または情報アーキテクチャの同義語と見なされることがよくありますが、私は同意しません。インフォグラフィックス-私にとって-一連のグラフ、図、イラストには、データの読み取り方法に関する偏ったステートメントが含まれている可能性があります。客観的ではなく、作成者の「関心」にないデータをスキップする傾向があります。あなたは誰かが事前に定義した結論に導かれます。エンターテインメントの価値があり、多くの場合、データから焦点を奪うイラストの圧倒的な使用があります。これは問題ありませんが、少し差別化すべきだと思います。
例
ビッグデータ:
ビッグデータは複雑なデータと同じではないことに注意してください。このLinkedInマップのように、多くのデータがまったく同じになる場合があります。コアデータは同じですが、(タグ付けによる)フィルターがあります。2つの変数があります。地理と、人々を職業/関心/関係に定義する何らかのタグです。異常な量のデータ。ただし、2つの変数のみです。
多変数:
以下は、データの多変数視覚化の例です。これは、チャールズミナードの1869年のチャートで、1812年のナポレオンのロシア軍の兵士の数、動き、そして帰路で遭遇した気温を示しています。
ビッグバージョンはこちら。
コードをクラックするのに少し時間がかかりますが、それを行うと素晴らしいです。対象となる変数は次のとおりです。
- 軍隊の規模(ライブ/デッドの数)
- 地理的位置
- 方向(東-西)
- 温度
- 時間(日付)
- 因果関係(戦闘および寒さで死亡)
これは、シンプルな2色のマップに含まれる驚くべき量の情報です。地理的な部分は他の変数に余裕を持たせるために様式化されていますが、それを取得するのに問題はありません。
ここに、よりトリッキーなものがあります。基本的な進化の視覚化、クラドグラム、系統発生学、生物地理学の原理に精通している場合、これは読みやすくなります。これに精通している人々のために作られていることを心に留めておいてください、それは専門家、科学的なチャートです。南アメリカの毒カエルの系統の系統地理的画像。左側のマップは、時間とともに変化する主要な生物地理学的領域を示し、右側の画像は、生物地理学的起源に関連したカエルの系統を示しています。(サントスJC、コロマLA、サマーズK、コールドウェルJP、リーR他[CC-BY-SA-2.5(www.creativecommons.org/licenses/by-sa/2.5)]、ウィキメディアコモンズ経由)。「コードをクラック」すると、驚くほど有益な情報が得られます。
小さな倍数、スパークライン:
これを十分に強調することはできません。繰り返し情報の価値を過小評価したり、別々の同一の視覚化に分割したりしないでください。あるグラフを別のグラフと比較するのがかなり簡単である限り、これはまったく問題ありません。私たちはパターン検出機です。これは多くの場合、小さな倍数と呼ばれます。これらの画像を非常に迅速に分析する問題はほとんどありません。また、すべてを1つの大きなグラフに詰め込むことは、10個の小さなグラフがさらに適切に機能する場合には無意味です。
別のもの:
そして、異なるが繰り返しグラフィックを使用するもの:
スパークラインは、Edward Tufteによって造られた用語であり、
完全に機能する、完全にカスタマイズ可能なjavascriptライブラリに発展しました。これらは基本的に、「外部」オブジェクトとしてではなく、テキストの一部としてテキストに挿入できる小さなグラフです。デフォルトは次のようになります。
編集III(ノーベル賞受賞者)
私が見つけたこのデータの視覚化を追加する必要がありましたが、それは単にあまりにも優れています。ノーベル賞受賞者を示しています。大学、学部、科目、年、年齢、出身地、共有されたかどうか、学位レベル。確かに美しい証拠。これらはすべて定量化可能なデータです。詳細はこちら。
あなたのデータ
@Javiが提起する質問はすべて非常に重要です。
あなたがやろうとしているのは、思考のための視覚的なツールを作成することです。そのためには、最高の信号対雑音比を抽出する必要があります。苦労しているのは、さまざまな変数を持つデータを情報に関連付ける方法です。ここに質問があります。何がおおよそ正しい必要があり、何が正確に必要ですか?目的は何ですか?
バイアスをかけすぎずにデータを表示したいと考えています。相関関係がある場合は、読者自身に相関関係を見つけてもらいたいと思います。あなたの目的は、ハンバーガーが自分にとって悪いことや、女性が男性よりもハンバーガーの摂取量が少ないことを人々に伝えることではなく、それがデータに含まれている場合は「見える」ようにすることです(これらの3人が家族であるかどうかを想像してください。ハンバーガーを食べるグラフ全体の見方を少し変えてください)。
データセットは非常に小さいため、すべてをテーブルに入れるだけで十分です。しかし、もちろんこれは一般的なアイデアに関するものです。
少し詳細:時間 (年齢)は、左から右(タイムライン)に水平に見えるものである傾向があります。アップダウンのようなものに重みを付けるので、x-yを切り替えることをお勧めします。
1.一意の固定エンティティとは何ですか?
2.(eh ..)変数変数とは何ですか?
- 重量(kg)
- 年齢(年)
- バーガーの数(整数)
- ハンバーガーの種類(整数)
注:データは完全にユニットで構成されています。個別のメンタルスケールでそれぞれカウント、定量化できます。キロ、年齢、体重、数字。また、データベースと言えば、その名前がキーです。時空の可視化を開始し始めると、それは本当に頭痛の種になります。出身地、現在の家などを追加する必要があると想像してください。
ここから2つだけの相関はハンバーガーの数で、天気をかどうか、それはコンボがあります。他のすべての変数は独立しており、1つだけが固定されています(名前)。ある時点で、大きなデータセットでは、名前でさえ面白くなくなり、人口統計、年齢、性別などに置き換えられます。
この小さなデータセットを使用すると、次のようにすべてを1つのグラフで取得できます。
または、軸と名前バブルのコンテンツを変更することもできます。
個人的なメモ:xとyには人間の「物理的」特性が含まれているため、これは2つの方が優れていると思います。ここのバブル内の変数は、ハンバーガーの数です。
グラフに加えて円グラフを追加したり、円グラフのみを追加することもできます。個人的には、小さな倍数について述べたように、両方があります:
あなたはそれでフライドポテトが欲しいですか?
私の推測では、ハンバーガーと食事の比率も知りたいと思っていました。すべての食事にはハンバーガーが含まれています。すべての食事が組み合わせであるわけではありません。
- 人が時々コンボミールを食べるかどうかだけを知りたいですか?
- それとも、ハンバーガーの食事のうち、いくつがコンボミールであるかを知りたいですか?
1.の場合、name / key / idにブール値が適用されます。
ジェーンは時々コンボミールを食べますか?真/偽。
2.の場合、ブール値を各食事に適用できます。
1チーズバーガー、combomeal = true
1チーズバーガー、combomeal = true
1チーズバーガー、comboreal = false
1チーズバーガー、comboreal = false
1チーズバーガー、comboreal = false
1チーズバーガー、comboreal = false
1チーズバーガー、comboreal = false
1ビーフバーガー、combomeal = true
1ビーフバーガー、combomeal = true
1ビーフバーガー、comomeal = false
これは非常に退屈なので、次のように分類できます。
ジェーンは10個のハンバーガーを食べます。これらのうち、3つはコンボです(「フライドポテトが必要ですか?」)。
組み合わせの1つは、ビーフバーガーメニューです。
組み合わせの2つはチーズバーガーメニューです。
残りはシングルバーガーです。5チーズ、2ビーフ。
この円グラフは、それを視覚化する試みでした。このバージョンでは、より明確にするためにパイスライスを保持しています。これに関することは、大きなデータセットと%の適用を開始することはまったくないということです。
しかし、最善の方法は考え直すことだと思います。
別の見方をすれば、本当に本当に簡単です。ここでは、どの年齢グループ、どの体重グループ、および「持っていない」すべてのデータがわかります。持っているデータはスペース関連ではなく、単位のみです(kg、年、数字+キー/ ID /名前):
(編集:私の顔に卵:「すべての食事はハンバーガーであり、すべての食事がコンボではない」に関して、これらの画像をより正確なものに置き換えました)
これは、より多くの人で簡単に拡張できます。
または、10歳、20歳、30歳の年齢層を比較すると、統計の視覚化を非常に簡単に読むことができます。
..できるだけ明確にするため。この考え方の例を次に示します。このチャートは、タイタニックの生存者、乗組員、クラス、男性、女性の比率を示しています。
他にも多くのソリューションがありますが、これらはほんの一例です。
私は何度も続けることができましたが、今は自分自身とおそらく他のみんなを疲れさせています。
使用するツール:
ゲフィ
Gapminder Hans Roslingによるこの驚異的なTEDプレゼンテーションをご覧ください。
Googleチャート
ソンビス
ラファエル
MIT展示(以前はSimilieと呼ばれていました)
d3
ハイチャート
参考文献:
PJオノリ; ハードの防衛
エドワード・タフテ:美しい証拠
エドワード・タフテ:構想情報
エドワード・タフテ:定量的情報の視覚的表示
視覚的説明:画像と量、証拠と物語
男性、アラン、2007年理論と文脈の観点からの説明スイス、ローザンヌ。ニューヨーク、ニューヨーク:AVA Academia
アイルズ、C。&ロバーツ、R.、1997。可視光、芸術、科学、日常の写真と分類、近代美術館オックスフォード。
カード、SK、マッキンレイ、J。&シュナイダーマン、B。編、1999。
Grafton、A.&Rosenberg、D.、2010。時間の地図作成:タイムラインの歴史、プリンストン建築出版。
リマ、M.、2011。視覚的複雑性:情報のマッピングパターン、プリンストン建築出版。
Bounford、T.、2000。デジタルダイアグラム:統計情報を効果的に設計および表示する方法0 ed。、Watson-Guptill。
Steele、J.&Iliinsky、N. eds。、2010. Beautiful Visualization:Experts Eyes the Experts of Experts 1st ed。、O'Reilly Media。
Gleick、J.、2011年。情報:歴史、理論、洪水、パンテオン