データ視覚化のための良い本や参考書は何ですか?


7

効果的なグラフ/データ視覚化の作成に関する参考資料を探しています。

特定のツール(R / ggplotとpython / pandasなど)を使用してデータの視覚化を作成する方法を示す本をたくさん見つけましたが、それは私が探しているものではありません。統計/数学に関してさまざまな種類のグラフを説明するリファレンスを探しています。プロセスよりも理論が欲しい。

さまざまな種類のグラフとその使用方法を知りたい。何か助けて!

回答:


11

ウィリアム・クリーブランドの仕事は、タフテの仕事に近いものになると思います。クリーブランドは2冊の本を書いた:

  1. データの視覚化(1993)
  2. グラフ化データの要素(1985)

特に最初の本はあなたが望むものかもしれません。これは出版社の説明です:

データの視覚化は、データの構造への深い洞察を提供する視覚化ツールに関するものです。コプロット、マルチウェイドットプロット、均等カウントアルゴリズムなどのグラフィカルツールがあります。方程式、ノンパラメトリックカーブ、ノンパラメトリックサーフェスをデータにフィットするレスやビススクエアなどのフィッティングツールがあります。しかし、この本は、単なる便利なツールの要約ではありません。これは、データの構造を徹底的に調査し、データに適合した統計モデルの有効性をチェックするための視覚化の使用を強調するデータ分析の戦略を伝えます。ツールと戦略の結果、データから学べることが大幅に増加します。本は、科学文献からの多くのデータセットを再分析することによってこれを実証します、見逃された効果とデータに適合された不適切なモデルを明らかにします。

さらに理論的な本は、リーランド・ウィルキンソンによるグラフィックの文法です。説明:

この本は、統計学者、コンピューター科学者、地理学者、研究者、およびデータの視覚化に関心のある人のために書かれました。これは、科学雑誌、新聞、統計パッケージ、およびデータ視覚化システムに含まれるほぼすべての定量的グラフィックを作成するための独自の基盤を提供します。この作業の具体的な結果はいくつかの可視化ソフトウェアライブラリでしたが、この本は、データから定量的なグラフィックスを生成することに関わる深い構造に焦点を当てています。円グラフ、棒グラフ、散布図、関数プロット、マップ、モザイクの作成の基礎となるルールは何ですか?そしてレーダーチャート?理論的および数学的基礎にあまり興味がない人でも、システムが生成できる多数の、多くの場合固有のカラーグラフィックスを調べることにより、システムの豊かさと構造の感覚をつかむことができます。第2版​​はオリジナルのほぼ2倍のサイズで、6つの新しい章と大幅な改訂が行われています。追加された資料の多くは、この本を視覚化および統計グラフィックスの調査コースに適しています。

この本は非常に理論的です。


2
エレメンツブック1994年の第2版。私はクリーブランドのこの支持を強く反映します。Tufteは素晴らしいですが、クリーブランドは統計的に関心のある人には、より直接的かつ技術的な詳細を話します。これらの本は本当に根本的な意味で古くはないと付け加えます。
Nick Cox

2
ウィルキンソンの本には、包括的な(またはアンダーピニング)理論があります。これは、Hadley Wickham ggplot2がRで彼を設計する際にその上に構築したという事実によって最も賞賛されます。
Nick Cox

6

Ed Tufteが書いた一連の本を見てください。これらについては、ウィキペディアの記事https://en.wikipedia.org/wiki/Edward_Tufteで説明されています

  1. 定量的情報の視覚的表示。1983; 2001年第2版。コネチカット州チェシャー:グラフィックプレス

  2. ビジョン情報。1990.コネチカット州チェシャー:グラフィックスプレス

  3. 視覚的説明:画像と数量、証拠、ナラティブグラフィックスプレス。1997.コネチカット州チェシャー:グラフィックスプレス

  4. 美しい証拠。2006.コネチカット州チェシャー:グラフィックスプレス


私は参照を与えました、そして私の答えは短すぎません。
マイケルR.チェニック2017

1
このような「リスト」の質問への回答には、推奨の正当な理由を少なくとも含めてください。 理由を提供しない回答は通常、削除されるか、コメントに変換されます。
whuber

1
@whuberエドワード・タフテが書いた3冊の本を参考にして、非常に適切な答えを出しました。より良い提案がありますか?
Michael R. Chernick

1
はい。まず、タイトルごとに各本を個別に示します。それらの指示とともに、その本の推奨が質問にどのように応答するかを説明します。タフティはどんな理論や理論を進歩させますか?特定の観点から?これらのテキストを参照する価値があるのはなぜですか?それらはどのように異なるのですか? その他
whuber

2
タフテの自費出版の4冊のうち2冊目(現在まで)を追加しました(彼の以前の本ではグラフィックスは二次的なテーマであることに注意してください)。マイケルの表彰を非難するつもりはありません。
Nick Cox

5

十字架につけられる危険を冒して、タフテ、ウィルキンソン、クリーブランドなど、他のすべての古典に反対することをお勧めします。

その理由は、あなたが説明した次の目的です(強調が追加されています)。

効果的なグラフ/データ視覚化の作成に関する参考資料を探しています。

したがって、言語に依存する本やチュートリアルを明示的に望んでいなくても、コーヒーを使った抽象的な理論的な演習ではなく、知識を適用する必要があります。私が古典と呼ぶものから始めると、あなたはあなたの言語をもっと雄弁にしたいので、シェイクスピアを読むようなものです。本の中での議論は、効果的なデータの視覚化を理解するための基礎を築くのに最適です。しかし、今日までの技術的進歩を考えると、書籍は応用的な心の発達にあまり役立ちません(グラフィックスの文法-ウィルキンソンは関連性ggplot2があるためわずかな例外ですが、その場合はハドリー・ウィッカムの著作を読むことをお勧めします、代わりにパッケージ作成者)。

あなたが見ることができるいくつかの優れたリソースは、FlowingData(Nathan Yau)、Perceptual Edge(Stephen Few)、Storytelling with Data(Cole Knaflic)、およびブログの著者による本です。その理由は次のとおりです。

  1. これらの作品はすでに古典からの研究を網羅しています
  2. 言語が学問的でなく、理解しやすい
  3. 定期的に更新されるブログは、本の補足資料として機能します

残念なことにアーロンコブリンは、大量のデータの視覚化に関する彼のユニークな見方に関する本を出版していません。

タフテ、クリーブランド、ウィルキンソンの研究がどれほど有用であるかを軽視するつもりはありませんが、それらのいくつかを試してみて、それでも最新のデータ視覚化ツールでわずかに上手くなっているだけなのです。


4

それはあなたが好む言語に強く依存します。私はデータの視覚化にPythonを頻繁に使用していないので、Rでのデータの視覚化に関連する書籍のみをお勧めします。1、Nr。2そして多分Nr。4が最も理論的かもしれません。Nr。6は、教師なし機械学習手法の視覚化に特化した理論的な側面も説明します。

  1. Paul MurrellによるRグラフィック

著者Paul Murrellは、R言語のグラフィックスの開発に重要な役割を果たしています。彼は、ggplot2ライブラリーの基礎となる概念である「Grammar of Graphics」の概念を開発しました。この本はかなり進んでいますが、必要な知識はあまり必要なく、かなり理論的ではありません。Rでのデータ視覚化の概念を本当に理解したい人には最適な本ですが、初心者にはお勧めしません。

  1. HTMLウィジェット

インタラクティブなデータ視覚化には必須です。さまざまなJavaScriptライブラリがRに翻訳され、Rに適合します。RShiny、Markdown(HTMLとしてレンダリング)、またはコンソールにほとんどのウィジェットを含めることができます。私のお気に入りのHTMLウィジェットは

  • Plotly(PythonやMatlabなどの他のさまざまな言語でも利用できるインタラクティブなデータ視覚化に関するライブラリ)
  • リーフレット(マップを使用したインタラクティブな視覚化)
  • dygraph(インタラクティブな時系列の視覚化に幅広いバリエーションを提供します)
  • datatable(knitRとbookdownパッケージも書いたRStudioのYuhui Xeによって書かれました。表を表示することで多作です))

    1. Rで美しいグラフィックを作成するためのガイド

この本は初心者にやさしいです。その例は主にggplot2に示されています。私がRIで高度なデータ視覚化手法を学び始めたとき、主にこれと公式のggplot2 Webサイトを使用しました。

  1. ggplot2の公式ウェブサイト

ggplot2を学ぶのに最適な出発点ですが、情熱を持ちたくない場合や時間がない場合は、圧倒的に表示されます。ggplot2は素晴らしいですが、学習曲線が急になる可能性があります。たとえば、行の先頭に「+」を書くことはできません。すべての理論的概念も説明されています。

  1. 公式シャイニーギャラリー

Shinyは、Rでアプリを構築するために最も使用されるRライブラリです。TableauやQlickviewなどのBIツールで置き換えることができます。shinyjsは、shinyとjavascriptを組み合わせたshinyの優れた拡張ですが、HTML、CSS、JavaScriptを独自に含めることもできます。

  1. Rでのクラスター分析

この本は、美しいグラフィックガイド(nr.3)と同じ著者からのものです。これは、教師なし機械学習手法、特にクラスタリングを視覚化するための専門書です。

7. 簡単なチュートリアル

視覚化を始めただけで少し圧倒された場合。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.