回答:
ウィリアム・クリーブランドの仕事は、タフテの仕事に近いものになると思います。クリーブランドは2冊の本を書いた:
特に最初の本はあなたが望むものかもしれません。これは出版社の説明です:
データの視覚化は、データの構造への深い洞察を提供する視覚化ツールに関するものです。コプロット、マルチウェイドットプロット、均等カウントアルゴリズムなどのグラフィカルツールがあります。方程式、ノンパラメトリックカーブ、ノンパラメトリックサーフェスをデータにフィットするレスやビススクエアなどのフィッティングツールがあります。しかし、この本は、単なる便利なツールの要約ではありません。これは、データの構造を徹底的に調査し、データに適合した統計モデルの有効性をチェックするための視覚化の使用を強調するデータ分析の戦略を伝えます。ツールと戦略の結果、データから学べることが大幅に増加します。本は、科学文献からの多くのデータセットを再分析することによってこれを実証します、見逃された効果とデータに適合された不適切なモデルを明らかにします。
さらに理論的な本は、リーランド・ウィルキンソンによるグラフィックの文法です。説明:
この本は、統計学者、コンピューター科学者、地理学者、研究者、およびデータの視覚化に関心のある人のために書かれました。これは、科学雑誌、新聞、統計パッケージ、およびデータ視覚化システムに含まれるほぼすべての定量的グラフィックを作成するための独自の基盤を提供します。この作業の具体的な結果はいくつかの可視化ソフトウェアライブラリでしたが、この本は、データから定量的なグラフィックスを生成することに関わる深い構造に焦点を当てています。円グラフ、棒グラフ、散布図、関数プロット、マップ、モザイクの作成の基礎となるルールは何ですか?そしてレーダーチャート?理論的および数学的基礎にあまり興味がない人でも、システムが生成できる多数の、多くの場合固有のカラーグラフィックスを調べることにより、システムの豊かさと構造の感覚をつかむことができます。第2版はオリジナルのほぼ2倍のサイズで、6つの新しい章と大幅な改訂が行われています。追加された資料の多くは、この本を視覚化および統計グラフィックスの調査コースに適しています。
この本は非常に理論的です。
ggplot2
がRで彼を設計する際にその上に構築したという事実によって最も賞賛されます。
Ed Tufteが書いた一連の本を見てください。これらについては、ウィキペディアの記事https://en.wikipedia.org/wiki/Edward_Tufteで説明されています。
定量的情報の視覚的表示。1983; 2001年第2版。コネチカット州チェシャー:グラフィックプレス
ビジョン情報。1990.コネチカット州チェシャー:グラフィックスプレス
視覚的説明:画像と数量、証拠、ナラティブグラフィックスプレス。1997.コネチカット州チェシャー:グラフィックスプレス
美しい証拠。2006.コネチカット州チェシャー:グラフィックスプレス
十字架につけられる危険を冒して、タフテ、ウィルキンソン、クリーブランドなど、他のすべての古典に反対することをお勧めします。
その理由は、あなたが説明した次の目的です(強調が追加されています)。
効果的なグラフ/データ視覚化の作成に関する参考資料を探しています。
したがって、言語に依存する本やチュートリアルを明示的に望んでいなくても、コーヒーを使った抽象的な理論的な演習ではなく、知識を適用する必要があります。私が古典と呼ぶものから始めると、あなたはあなたの言語をもっと雄弁にしたいので、シェイクスピアを読むようなものです。本の中での議論は、効果的なデータの視覚化を理解するための基礎を築くのに最適です。しかし、今日までの技術的進歩を考えると、書籍は応用的な心の発達にあまり役立ちません(グラフィックスの文法-ウィルキンソンは関連性ggplot2
があるためわずかな例外ですが、その場合はハドリー・ウィッカムの著作を読むことをお勧めします、代わりにパッケージ作成者)。
あなたが見ることができるいくつかの優れたリソースは、FlowingData(Nathan Yau)、Perceptual Edge(Stephen Few)、Storytelling with Data(Cole Knaflic)、およびブログの著者による本です。その理由は次のとおりです。
残念なことに、アーロンコブリンは、大量のデータの視覚化に関する彼のユニークな見方に関する本を出版していません。
タフテ、クリーブランド、ウィルキンソンの研究がどれほど有用であるかを軽視するつもりはありませんが、それらのいくつかを試してみて、それでも最新のデータ視覚化ツールでわずかに上手くなっているだけなのです。
それはあなたが好む言語に強く依存します。私はデータの視覚化にPythonを頻繁に使用していないので、Rでのデータの視覚化に関連する書籍のみをお勧めします。1、Nr。2そして多分Nr。4が最も理論的かもしれません。Nr。6は、教師なし機械学習手法の視覚化に特化した理論的な側面も説明します。
著者Paul Murrellは、R言語のグラフィックスの開発に重要な役割を果たしています。彼は、ggplot2ライブラリーの基礎となる概念である「Grammar of Graphics」の概念を開発しました。この本はかなり進んでいますが、必要な知識はあまり必要なく、かなり理論的ではありません。Rでのデータ視覚化の概念を本当に理解したい人には最適な本ですが、初心者にはお勧めしません。
インタラクティブなデータ視覚化には必須です。さまざまなJavaScriptライブラリがRに翻訳され、Rに適合します。RShiny、Markdown(HTMLとしてレンダリング)、またはコンソールにほとんどのウィジェットを含めることができます。私のお気に入りのHTMLウィジェットは
datatable(knitRとbookdownパッケージも書いたRStudioのYuhui Xeによって書かれました。表を表示することで多作です))
この本は初心者にやさしいです。その例は主にggplot2に示されています。私がRIで高度なデータ視覚化手法を学び始めたとき、主にこれと公式のggplot2 Webサイトを使用しました。
ggplot2を学ぶのに最適な出発点ですが、情熱を持ちたくない場合や時間がない場合は、圧倒的に表示されます。ggplot2は素晴らしいですが、学習曲線が急になる可能性があります。たとえば、行の先頭に「+」を書くことはできません。すべての理論的概念も説明されています。
Shinyは、Rでアプリを構築するために最も使用されるRライブラリです。TableauやQlickviewなどのBIツールで置き換えることができます。shinyjsは、shinyとjavascriptを組み合わせたshinyの優れた拡張ですが、HTML、CSS、JavaScriptを独自に含めることもできます。
この本は、美しいグラフィックのガイド(nr.3)と同じ著者からのものです。これは、教師なし機械学習手法、特にクラスタリングを視覚化するための専門書です。
7. 簡単なチュートリアル
視覚化を始めただけで少し圧倒された場合。
Garret GrolemundおよびHadley WickhamによるデータサイエンスのR