私はTukeyの本「Exploratory Data Analysis」を読んでいます。1977年に書かれて、本は紙/鉛筆方法を強調します。大きなデータセットを瞬時にプロットできることを考慮した、より「現代的な」後継機はありますか?
私はTukeyの本「Exploratory Data Analysis」を読んでいます。1977年に書かれて、本は紙/鉛筆方法を強調します。大きなデータセットを瞬時にプロットできることを考慮した、より「現代的な」後継機はありますか?
回答:
最も近いものは、クリーブランドの視覚化データです。探索的データ分析、コンピューター生成の視覚化、深遠、古典的です。
まあ、それは正確なレプリカではありませんが、回帰とマルチレベル/階層モデルを使用したGelman and Hillのデータ分析で多くの有用なプロットアドバイス(およびRコード)を見つけました
さらに、彼のブログには、有用なグラフィックスのアドバイスが満載です。
データ分析用のインタラクティブグラフィックス:原則と例は私が気に入っているものです。本の説明では、「探索的データ分析(EDA)と、対話型のグラフィカルな方法が洞察を獲得し、データセットから新しい質問と仮説を生成する方法を説明しています。」
Hadley Wickhamのggplot2本は、Grammar of Graphicsとggplot2ソフトウェアの使用方法の両方を教えているので興味深いです。
ロナルドピアソンの工学、科学、および医学のデータ探索については、ここで言及する価値があります。主な対象読者は、より多くの統計を知ってほしいと願う小さな数学を恐れない科学者のようです。これは非常に大きなグループであり、ここでよく表されています。それは少し風変わりで風変わりですが、それは多くの地面をカバーし、多くの賢明なアドバイスが含まれています。多くの新しいアイデアを提供するという意味でテューキーを再訪するわけではありませんが、少し間違っていると思われる場合でも、勉強するのはやりがいがあります。
この本はほとんど注目を集めていないようです。それはおそらく非常に高価であり、明らかにコーステキストとしては適切ではなく、ハードカバーでのみ入手可能であるためです。しかし、それは知的で読みやすく、現代の入門教科書(初歩のページやページ、愚かなアイコン、幸せな若者の無料の写真、箱のあるうるさいレイアウトなど)のゴミがありません。
また、データ分析のための対話とダイナミックなグラフィックス:RとGGobi、クックとSwayneを使用した例を挙げて
これには、Webで公開されている2つの章があり、データ分析のプロセスと欠損値の処理について説明しています。Antony Unwinによる新しい本がまもなく公開されます。
読むべきもう1つの良い本は、Beautiful VisualizationとBeautiful Dataです。これらは編集された本であり、プロットを使用してデータを探索する驚くほど良い例と、いくつかの絶対に恐ろしい章があります。
ggplot2を使用したいくつかの良い例がある別の本は、Winston Changによる新しい本です。