(非常に)短編小説
簡単に言えば、ある意味では、統計は他の技術分野と同じです:速いトラックはありません。
長い話
統計学の学士号プログラムは米国では比較的まれです。これが真実だと思う理由の1つは、統計を十分に学部のカリキュラムに学習するために必要なすべてを詰め込むのが非常に難しいことです。これは、重要な一般教育の要件がある大学で特に当てはまります。
必要なスキル(数学、計算、直感)の開発には多くの労力と時間がかかります。生徒が微積分と適切な量の線形代数と行列代数を習得すると、統計はかなり適切な「運用」レベルで理解し始めることができます。ただし、応用統計学者は、統計に対するクッキーカッターまたはレシピベースのアプローチに準拠していない領域で自分を見つけるのは非常に簡単であることを知っています。表面下で何が起こっているかを本当に理解するには、前提条件として必要です数学的な、そして今日の世界では、後年の学部での訓練でしか実際に達成できない計算上の成熟度。これは、真の統計トレーニングが主に米国のMSレベルで始まる理由の1つです(インド、専用のISIとは少し異なる話です。カナダを拠点とする一部の教育についても同様の議論が行われる可能性があります。情報に基づいた意見を持つための、欧州ベースまたはロシアベースの学部統計教育。
ほぼすべての(興味深い)仕事にはMSレベルの教育が必要であり、(私の意見では)本当に興味深い仕事には基本的に博士レベルの教育が必要です。
あなたが数学の博士号を持っているのを見て、私たちはどの分野にいるのかわかりませんが、ここではMSレベルの教育に近い何かのための私の提案があります。選択肢を説明するためにいくつかの括弧付きのコメントを含めます。
- D.ハフ、統計で嘘をつく方法。(非常に迅速で読みやすい。特に統計を素人に提示する際の概念的なアイデアと落とし穴の多くを示している。)
- Mood、Graybill、およびBoes、統計理論入門、第3版、1974。意見としては、これはCasella&BergerやRiceなどの現代の対応物よりも一般的に優れており、少し進歩しているということです。
- Seber&Lee、線形回帰分析、第2版 (線形モデルの点推定と仮説検定の背後にある理論を配置します。これは、おそらく応用統計で理解する最も重要なトピックです。おそらく、優れた線形代数の背景を持っているので、幾何学的に何が起こっているかをすぐに理解できるはずです、これは多くの直観を提供します。また、モデル選択の評価の問題、仮定からの逸脱、予測、および線形モデルの堅牢なバージョンに関連する優れた情報もあります。
- Hastie、Tibshirani、Friedman、Elements of Statistics Learning、第2版、2009年(この本は、前回よりもはるかに応用感があり、多くの現代の機械学習トピックを幅広くカバーしています。ここでの主な貢献は、統計的解釈の提供です。多くの機械学習のアイデア、特にそのようなモデルの不確実性を定量化することで成果を上げます。これは、典型的な機械学習の本では取り扱われない傾向があります。
- A. Agresti、カテゴリーデータ分析、第2版。(統計的枠組みで離散データを処理する方法の優れたプレゼンテーション。優れた理論と優れた実用的な例。おそらくいくつかの点で伝統的な側面について。)
- ボイド&Vandenberghe、凸最適化。(最も一般的な現代の統計的推定および仮説検定問題の多くは、凸最適化問題として定式化できます。これは、SVMなどの多数の機械学習手法にも当てはまります。とても価値があると思います。ここで合法的に無料で入手できます。)
- Efron&Tibshirani、ブートストラップの紹介。(少なくともブートストラップと関連技術に精通している必要があります。教科書の場合は、すばやく簡単に読むことができます。)
- J. Liu、科学計算のモンテカルロ戦略またはP. Glasserman、金融工学のモンテカルロ法。(後者は特定のアプリケーション分野に非常に向けられているように聞こえますが、すべての最も重要な手法の概要と実用的な例を提供すると思います。金融工学アプリケーションは、過去10年ほどでかなりの量のモンテカルロ研究を推進しました)
- E. Tufte、定量的情報の視覚表示。(データの優れた視覚化と表示は、統計学者によっても[非常に]過小評価されています。)
- J. Tukey、探索的データ分析。(標準。旧型だが、旧型。時代遅れと言う人もいるかもしれませんが、それでも見る価値はあります。)
補数
ここに、他のいくつかの本がありますが、大部分はより高度で、理論的および/または補助的な性質のもので、役に立つものです。
- FAグレイビル、線形モデルの理論と応用。(昔ながらのひどい組版ですが、Seber&Leeのすべての分野をカバーしています。より現代的な治療法はおそらくSVDを使用して多くのテクニックと証明を統一および単純化する傾向があるため、私は昔ながらのスタイルを言います。)
- FAグレイビル、統計学における応用のある行列。(上記のコンパニオンテキスト。ここでは統計に役立つ優れたマトリックス代数が豊富に得られます。優れたデスクリファレンス。)
- Devroye、Gyorfi、およびLugosi、パターン認識の確率論。(分類問題のパフォーマンスの定量化に関する厳密で理論的なテキスト。)
- ブロックウェル&デイビス、時系列:理論と方法。(古典的な時系列分析。理論的処理。より応用的なものについては、Box、Jenkins&Reinsel、またはRuey Tsayのテキストはまともです。)
- Motwani and Raghavan、ランダム化アルゴリズム。(計算アルゴリズムの確率的方法と分析。)
- D.ウィリアムズ、Probability and Martingalesおよび/またはR. Durrett、Probability:Theory and Examples。(たとえば、DL Cohnのレベルでメジャー理論を見たことがありますが、確率理論ではない場合があります。メジャー理論をすでに知っている場合は、どちらも迅速に理解するのに適しています。)
- F.ハレル、回帰モデリング戦略。(統計学習の要素 [ESL] ほど良くはありませんが、異なる、興味深い、物事を引き受けます。ESLよりも「伝統的な」応用統計のトピックをカバーしており、確実に知る価値があります。)
より高度な(Doctorateレベルの)テキスト
Lehmann and Casella、ポイント推定の理論。(ポイント推定のPhDレベルの扱い。この本の課題の一部は、それを読んで、タイプミスとそうでないものを理解することです。あなたがすぐにそれらを認識しているのを見れば、あなたは理解していることがわかります。特に問題に飛び込む場合は、このタイプのものを使用します。)
レーマンとロマーノ、統計的仮説のテスト。(仮説検定のPhDレベルの処理。上記のTPEほど多くのタイプミスはありません。)
A. van der Vaart、漸近統計学。(統計の漸近的理論に関する美しい本で、応用分野についての良いヒントがあります。しかし応用された本ではありません。私の奇妙な表記は、奇妙な表記が使われ、詳細が時々敷物の下に書かれていることです。)