Rを使用した統計のリファレンスブック–存在し、何を含めるべきですか?


25

バックグラウンド

これについては多くの議論があるので、StackExchangeの以前のトレッドから、そして猛烈にグーグルで答えを見つけることができると思いました。Rで(バイオ)統計のリファレンスブックを1つだけ見つけようとして半日使った後、私はまったく混乱し、あきらめなければなりませんでした。たぶん、無料の資料を組み合わせると、現時点で購入できるどの本よりも優れているかもしれません。調べてみましょう。

インターネットにはR言語の優れた無料の文献がたくさんあります。そのため、ほとんどの場合オフィスの装飾として使用される平凡な本にお金を払っても意味がありません。Rのホームサイトには、Rに関連する書籍が一覧表示されており、多くの書籍があります。より正確に言うと、115。そのうちの1つだけが「スタンドアロン統計リファレンスブック」という言葉で宣伝されています。現在8歳であり、古い可能性があります。Sを使用したModern Applied Statisticsの第4版はさらに古いです。R Bookは、参照が不足しているため、コードの形式が適切でなく、仕上がりが粗末であるため、あまりにも基本的お勧めできません

しかし、私は1冊の本を探しています。これは、実用的な統計(何よりもまず)とR(二次)のスタンドアロン参照として使用できます。本は私の本棚に置いて、本棚のほこりの代わりに注釈、コーヒーの染み、脂っこい指紋を集めます。これは、これまで使用してきた無料のpdfのコレクションを置き換えるものであり、Rに優れた参照ライブラリが付属していることを忘れないでください。“ 適切なアプローチは何ですか?」、「なぜですか?技術的には、どのように機能しますか?」は、「Rでそれを行う方法」よりも多くの難問です

私は生態学者なので、生物統計学への応用にほとんど興味があります。しかし、これらのことはしばしば結びついているため、学際的な一般的な参考文献は私にとって最も価値があるでしょう。

タスク

そのような本が存在する場合(疑わしい)、本の名前(回答ごとに1つのみ)と、その本のトピックのリファレンスブックとして指定する理由を説明する本の短いレビューを提供してください。この質問は既存のものとそれほど違わないので、答えにこのトレッドを使用してください。また、理想的な参考書の機能としてそれらをリストできるように、本の欠陥をリストすることもできます。

私の質問は、Rの統計(ほとんどの種類)のリファレンスブックに何を含めるべきですか?

いくつかの最初の考えは、次の一般的な機能です(更新してください)。

  • レンガのように厚い
  • 簡潔だが理解しやすい
  • 数字で埋める(提供されたRコード付き)
  • テキストから最も重要な詳細を説明するわかりやすい表と図
  • 最も重要な方程式を含む統計/方法に関するわかりやすい説明テキスト。
  • 各アプローチの良い例(Rコードを使用)
  • 広範な最新の参照リスト
  • タイプミスの最小数

目次

私は統計学者ではないので、質問に答えるためにこの(存在しない?)本が必要になるので、内容について書くのは難しいです。のでR帳がはっきりRと統計のための参考書になろうとするが、しばしば批判されて、私は、スタンドアロンR統計参考書の目次するための出発点として、本から目次をコピーしました。追加タスク:目次に追加、提案、削除などを提供してください。

  1. 入門
  2. R言語の要点
  3. データ入力
  4. データフレーム
  5. グラフィックス
  6. テーブル
  7. 数学
  8. 古典的なテスト
  9. 統計モデリング
  10. 回帰
  11. 分散分析
  12. 共分散分析
  13. 一般化線形モデル
  14. カウントデータ
  15. テーブル内のデータをカウントする
  16. 割合データ
  17. バイナリ応答変数
  18. 一般化された加算モデル
  19. 混合効果モデル
  20. 非線形回帰
  21. ツリーモデル
  22. 時系列分析
  23. 多変量統計
  24. 空間統計
  25. 生存分析
  26. シミュレーションモデル
  27. グラフィックスの外観を変更する
  28. 参考資料と参考資料
  29. 索引

以前に何が言われましたか?

StackExhangeには、統計とRブックの提案を求めるいくつかのトレッドが含まれています。R言語を学習するための本は、統計的側面のないR言語を学習する参考書について尋ねています。Art of Rプログラミングは、最高の単一提案としてランク付けされています。Rを使用して統計を学習するための本は、統計の理想的な入門書を求めていますが、これは実際には参考書と同じではありません。オープンソースの統計教科書では、多変量統計をRが最良の選択肢としてランク付けしています。統計学者以外の科学者にはどの本をお勧めしますか?選択したプログラムを指定せずに、最適な統計リファレンスブックについて尋ねます。おそらく私の質問に最も近いRスコアの実験計画データのシミュレーションに関する参考資料または本Rを使用した科学プログラミングとシミュレーションの紹介はここで最も推奨される本であり、私が探しているものに近いかもしれません。ただし、この本は、Rを使用した統計の単一の参考書としては不十分です。

リファレンスブックに関するいくつかの提案とその欠陥

R in Actionは、The R Bookよりも優れたレビューを受けていますが、どうやら入門です。

Rを使用した生物統計学的設計と分析:実用的なガイドは、おそらく私が探しているものに近いでしょう。それは良いレビューを受けましたが、明らかにこれには多くのタイプミスが含まれています。さらに、この本は統計の説明に集中するのではなく、研究者が使用する既製のレシピとして統計分析を提供します。

Rの生態学的モデルとデータは、入門レベルをスキップします。これは、「紹介」という単語がRブックリストで43回出現することを示す非常に便利な機能ですが、統計の参考書を追っている場合は、おそらく完全に満足のいくものではありません。

R使用した科学プログラミングとシミュレーションの概要は非常に好評でしたが、データシミュレーションに限定されています。

Richiemorrisroeは、ことを示唆しているSと現代応用統計は、優れたレビュー(受信したR.このブックでスタンドアロン統計参考書のために十分である12)、おそらく現時点でのタイトルのための最良の候補でありますか?最新バージョンは10年前にリリースされましたが、これはプログラム開発を考慮するとかなり長い時間です。

Dimitriy V. Masterovは、回帰モデルとマルチレベル/階層モデルを使用したデータ分析を提案しています。この本はまだチェックアウトしていません。


多くの書評を読んだ後、ここで尋ねられた完璧な本はまだ存在していないことが明らかです。ただし、かなり近いものを選択することはおそらく可能です。このトレッドは、統計ユーザーが既存の最高の参考書を見つけるためのコミュニティWikiとして、また新旧の作家が作品を改善するための動機付けとして意図されています。


3
(+1)良いレビューのために!しかし、あなたはあなた自身の質問の中にあなた自身の質問に答えたようです
...-ocram

1
あなたがこれを理解するのに多くの時間を費やし、あなた自身の長いリストとそのような本の概要さえ考え出すなら、あなたはそれを書くべきかもしれません。これは、誰かが[BLAH]の良いレビューペーパーを求めて、既存の5つか10のレビューペーパーについて気に入らないことを議論するときに、統計リストと計量経済学のリストによくお勧めします。
StasK

回答:


12

私は、S-Plusを使用したModern Applied Statisticsが、あなたが概説したすべてのボックスにチェックを入れると個人的に考えました。すべての例にはRコードがあり、他のソースへの適切な参照を提供します。また、VenablesとRipleyには素晴らしく簡潔で説明的な書き方があり、本当に感謝しています。私は本を​​頻繁に再読する傾向があり、そのたびに本を読みます。もちろん、走行距離は異なる場合があります。


2
同意する。私はRベースの統計書をたくさん持っています。MASS4はおそらくあなたが探しているものに最も近いでしょうが、場所によっては「簡潔」が読みにくくなり、私よりも多くの統計的背景知識が必要になります。そうは言っても、私はこの本を10年近く持っており、その本に戻って新しいことを学び続けています。その年齢があなたを先送りにすることはできません。ああ、私は今統計を行っていますphd :-)
ショーン

また、MASSに何度も戻りますが、MASSはリファレンスブックとして明らかにされているようです。
ピーターエリス

1998年のMASSバージョンは2003年と大きく異なりますか?内容の違いが、それに対してさらに£50を払うのに十分かどうか疑問に思います。
推測

6

このような良い質問をありがとう。特にそのすべての情報を編集してくれた。残念ながら、あなたが説明している本は存在せず、正直なところ、存在することはできませんでした。主に統計の参考書が欲しい場合は、線形モデルに関する非常に良い本から始めます。私の推薦はクトナーらです、体積と質量の両方がレンガよりも大きいという基準を満たし、非常に包括的で明確であり、多くの例があります。実際、Rの要件を削除すると、リスト全体がほとんど不要になります。私は頻繁にそれを参照します。ただし、〜1500ページでは、線形モデル(リグレッション、ANOVA)のみをカバーしていますが、他のいくつかのトピックに関する簡単な章がいくつかありますが、そのための他の本が本当に必要です。次に、使用する必要のある他の手法(生存分析、空間分析など)について、あなたに適したレベルで一流の統計参考書を入手します。これらの本が例としてRを使用していない場合、use-RのようなR固有の本を入手することができます。書籍、ただしドキュメント、ビネット、R-helpメーリングリスト、StackOverflow、およびCV、あなたがする必要はないかもしれません。Rで適切な方法でプログラミングすることを学びたい場合は、それらの本の1つも入手する必要があります。この時点で、少なくとも4冊の本があります。申し訳ありませんが、そうです。統計を広範囲に扱う人は、すべてを網羅した本を1つだけ持っていません。


5

このような本は存在しないと思います。最も近いと思う本は、Gelman and Hill's Data Analysis Using Regression and Multilevel / Hierarchical Modelsです。

短所:

  • 〜5歳で、社会科学者向けです。

  • TOCリストにすべてが含まれているわけではありません(空間的なものはありません。基本的には時系列などはありません)。

長所:

  • よく書かれました

  • リンクに正誤表と目次のリストがあります

  • 番号付きリストにないデータの欠落など、重要なことをカバーしています。

  • 箇条書きリストのほとんどのアイテムにヒットします。

  • 多数のグラフとRコード(マルチレベルのバグコード)。

  • すべてのデータ/コードをダウンロードできます。


4

私は統計的学習の要素に取り組んでいます。この本は信じられないほどの範囲のテクニックをカバーしています(700ページ以上)が、各アプローチは非常に理論的な方法ではなく、非常に実用的で明確に説明されています。Rについては何も明示的に含まれていませんが、プロットとグラフはすべてRで明確に作成されており、説明されているすべてのトピックのパッケージがCRANにあります。著者はすべて、Rの開発(および現代の機械学習技術のかなりの部分)に関与しています。


2
その本のRパッケージもあります:ElemStatLearn :-)
chl

3

MASS4は要求に非常によく適合し、他の回答者と同じ経験を持ち、かなり高度な統計的洗練度の要件を満たすことが困難であるという、現在のトップ投票の回答に同意しました。実際、MASS3は私の最初の "Rbook"であり、その能力においてかなり役立ちました。私はCrawleyの「The R Book」を購入しましたが、R言語の不正確な記述と、統計理論の深さを欠いていると思われる一連の実例にすぎないという点で、それが不十分であることがわかりました。

しかし、時間の経過とともに、Harrellの「回帰モデリング戦略」(RMS)が、この質問の「生物統計学的」な焦点と、適切な深さを持つことにより適していることがわかりました。Rの紹介テキストではありません。そのためには、他の場所を調べる必要があります。そのため、Rを使用した科学プログラミングおよびシミュレーション入門[ http://www.crcpress.com/product/isbn/9781420068726]または(その名前)StackOverflowのR投稿タグへの長年の貢献者によって書かれた「R for Dummies」。RMSの初版は、Sに重点を置いていたときだけでしたが、それ以来、HarrellはRに切り替えて、rms/HmiscRパッケージデュオ。これは、空間分析や混合モデル用ではありませんが、リストされているいくつかのドメインでの専門的なカバレッジに関する@gungの提案を満たすと思います。


1
RMSとMASSの両方を強くお勧めします。私は生物統計学ではありませんが、ハレルのアドバイスの大部分はより一般的に役立ちます。私はしばしば、将来の研究生にハレル、または少なくとも第4章を読むように頼み、その後、よく知っていることを確認するためにMASSを良い一般的な本として推奨することがよくあります。
Glen_b -Reinstate Monica

一般的な自習については、CoxとHinkleysの「理論統計」とFellerの2巻「Introduction to Probability Theory」を指名します。しかし、それは明らかにこの質問のR部分に取り組んでいない。
DWin

[私が監督する学生は、統計の範囲外の領域にいますが、その仕事にはかなりの量が関係しています... MASSとRMSは、CoxとHinkleyとFeller Vol 2よりも多くの場合に役立ちます。ケンドールとスチュアート-私自身の背景にとって非常に貴重
でした

2

翻訳したい場合...(これは4,900ページの理論書の付属書です):

ビッグRブック

この本(私は共著者)は、学部および大学院レベルでの15年間のコンサルティング経験と教育の集大成であり、4,900ページに数学の詳細(証明)が記載されているRの例のみを示しています。数値を使用して計算も手作業で行われるコンパニオンブック(+500ページは次のエディションで利用可能になります)。この本は、ソフトウェアが正しい値を与えることを確認する可能性も与えており、ヨーロッパの学校の大学院で通常教えられている科目について、手やMS Excelで計算するよりもはるかに楽しいです。この本の目的は、同じ結果を得るために多くのソフトウェアではなく1つのソフトウェアを(JMP + Minitab + SPSS + SAS + MATLABを併用する代わりに)コストなしで使用できることを示すことでもあります。この本は、Rの弱点も示しています(パッケージのメンテナンスは保証されていません)。また、さまざまなRフォーラムやブログに関する非常に価値のある質問の大要でもあります。無料でカラーです!


1
要求された「短いレビュー」も提供していただけますか?この本を推薦する理由は何ですか?それについての良い点と悪い点は何ですか?
whuber

私は共同監査人の一人です...短いレビューではあまり中立的ではありません...
ビンセントISOZ

1
それは大丈夫です-あなたがあなたの本の長所であると思うか、それから誰が恩恵を受けるだろうかの特徴づけをあなたから聞くことに感謝するでしょう。本への接続を開示することにより(これは不可欠です)、読者はあなたの発言を評価する際にそのことを説明できます。多くの読者は、あなたがこの本について熟知していることを理解し、あなたの言うことに感謝するだろうと思う。何らかのレビューを提供しないと、あなたの答えは、比較的注目を集めることのない単なるコメントに追いやられなければなりません。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.