数学者は、同等の知識を質の高い統計学の程度に望んでいます


77

私は人々が重複を閉じるのが好きであることを知っているので、統計の学習を開始するための参照を求めていませんこちら)。

私は数学の博士号を持っていますが、統計を学んだことはありません。一流のBS統計学の学位と同等の知識を得るための最短ルートは何ですか?それを達成したときにどのように測定しますか?

本のリストで十分な場合(演習で言うと仮定すると)、それは素晴らしいです。はい、問題を解決することはそれを学ぶことの暗黙の一部であると期待していますが、できるだけ現実に即して追跡したいと思います。統計学専攻が一般的に学んでいることの一部でない限り、私はめちゃくちゃ厳格な治療を探していません。


1
博士号を取得した数学の分野は何ですか?これは関連する可能性があります。
mpiktas

7
統計を学びたい理由を教えてください。好奇心?プロジェクトや研究に必要ですか?転職したいですか?いくつかのコースを教える必要がありますか?理論家として統計学者と協力したいですか?
whuberの

5
ドメイン固有の専門知識を開発することもほぼ常に重要だと思います。多くの統計が特定の分野に関連するモデルを学習しています。
トリスタン

10
「統計学者は質の高い数学の学位と同等の知識を必要としている」を逆にしてみてください-速いルートはないでしょう。
確率論的

1
「私は人々が複製を閉じるのが好きだと知っています」と私は笑いました。
ムスタファSエイサー

回答:


77

(非常に)短編小説

簡単に言えば、ある意味では、統計は他の技術分野と同じです:速いトラックはありません

長い話

統計学の学士号プログラムは米国では比較的まれです。これが真実だと思う理由の1つは、統計を十分に学部のカリキュラムに学習するために必要なすべてを詰め込むのが非常に難しいことです。これは、重要な一般教育の要件がある大学で特に当てはまります。

必要なスキル(数学、計算、直感)の開発には多くの労力と時間がかかります。生徒が微積分と適切な量の線形代数と行列代数を習得すると、統計はかなり適切な「運用」レベルで理解し始めることができます。ただし、応用統計学者は、統計に対するクッキーカッターまたはレシピベースのアプローチに準拠していない領域で自分を見つけるのは非常に簡単であることを知っています。表面下で何が起こっているかを本当に理解するには、前提条件として必要です数学的な、そして今日の世界では、後年の学部での訓練でしか実際に達成できない計算上の成熟度。これは、真の統計トレーニングが主に米国のMSレベルで始まる理由の1つです(インド、専用のISIとは少し異なる話です。カナダを拠点とする一部の教育についても同様の議論が行われる可能性があります。情報に基づいた意見を持つための、欧州ベースまたはロシアベースの学部統計教育。

ほぼすべての(興味深い)仕事にはMSレベルの教育が必要であり、(私の意見では)本当に興味深い仕事には基本的に博士レベルの教育が必要です。

あなたが数学の博士号を持っているのを見て、私たちはどの分野にいるのかわかりませんが、ここではMSレベルの教育に近い何かのための私の提案があります。選択肢を説明するためにいくつかの括弧付きのコメントを含めます。

  1. D.ハフ、統計で嘘をつく方法。(非常に迅速で読みやすい。特に統計を素人に提示する際の概念的なアイデアと落とし穴の多くを示している。)
  2. Mood、Graybill、およびBoes、統計理論入門、第3版、1974。意見としては、これはCasella&BergerやRiceなどの現代の対応物よりも一般的に優れており、少し進歩しているということです。
  3. Seber&Lee、線形回帰分析、第2版 (線形モデルの点推定と仮説検定の背後にある理論を配置します。これは、おそらく応用統計で理解する最も重要なトピックです。おそらく、優れた線形代数の背景を持っているので、幾何学的に何が起こっているかをすぐに理解できるはずです、これは多くの直観を提供します。また、モデル選択の評価の問題、仮定からの逸脱、予測、および線形モデルの堅牢なバージョンに関連する優れた情報もあります。
  4. Hastie、Tibshirani、Friedman、Elements of Statistics Learning、第2版、2009年(この本は、前回よりもはるかに応用感があり、多くの現代の機械学習トピックを幅広くカバーしています。ここでの主な貢献は、統計的解釈の提供です。多くの機械学習のアイデア、特にそのようなモデルの不確実性を定量化することで成果を上げます。これは、典型的な機械学習の本では取り扱われない傾向があります
  5. A. Agresti、カテゴリーデータ分析、第2版。(統計的枠組みで離散データを処理する方法の優れたプレゼンテーション。優れた理論と優れた実用的な例。おそらくいくつかの点で伝統的な側面について。)
  6. ボイド&Vandenberghe、凸最適化。(最も一般的な現代の統計的推定および仮説検定問題の多くは、凸最適化問題として定式化できます。これは、SVMなどの多数の機械学習手法にも当てはまります。とても価値があると思います。ここで合法的に無料入手できます。)
  7. Efron&Tibshirani、ブートストラップの紹介。(少なくともブートストラップと関連技術に精通している必要があります。教科書の場合は、すばやく簡単に読むことができます。)
  8. J. Liu、科学計算のモンテカルロ戦略またはP. Glasserman、金融工学のモンテカルロ法。(後者は特定のアプリケーション分野に非常に向けられているように聞こえますが、すべての最も重要な手法の概要と実用的な例を提供すると思います。金融工学アプリケーションは、過去10年ほどでかなりの量のモンテカルロ研究を推進しました)
  9. E. Tufte、定量的情報の視覚表示。(データの優れた視覚化と表示は、統計学者によっても[非常に]過小評価されています。)
  10. J. Tukey、探索的データ分析。(標準。旧型だが、旧型。時代遅れと言う人もいるかもしれませんが、それでも見る価値はあります。)

補数

ここに、他のいくつかの本がありますが、大部分はより高度で、理論的および/または補助的な性質のもので、役に立つものです。

  1. FAグレイビル、線形モデルの理論と応用。(昔ながらのひどい組版ですが、Seber&Leeのすべての分野をカバーしています。より現代的な治療法はおそらくSVDを使用して多くのテクニックと証明を統一および単純化する傾向があるため、私は昔ながらのスタイルを言います。)
  2. FAグレイビル、統計学における応用のある行列。(上記のコンパニオンテキスト。ここでは統計に役立つ優れたマトリックス代数が豊富に得られます。優れたデスクリファレンス。)
  3. Devroye、Gyorfi、およびLugosi、パターン認識の確率論。(分類問題のパフォーマンスの定量化に関する厳密で理論的なテキスト。)
  4. ブロックウェル&デイビス、時系列:理論と方法。(古典的な時系列分析。理論的処理。より応用的なものについては、Box、Jenkins&Reinsel、またはRuey Tsayのテキストはまともです。)
  5. Motwani and Raghavan、ランダム化アルゴリズム。(計算アルゴリズムの確率的方法と分析。)
  6. D.ウィリアムズ、Probability and Martingalesおよび/またはR. Durrett、Probability:Theory and Examples。(たとえば、DL Cohnのレベルでメジャー理論を見たことがありますが、確率理論ではない場合があります。メジャー理論をすでに知っている場合は、どちらも迅速に理解するのに適しています。)
  7. F.ハレル、回帰モデリング戦略。(統計学習の要素 [ESL] ほど良くはありませんが、異なる、興味深い、物事を引き受けます。ESLよりも「伝統的な」応用統計のトピックをカバーしており、確実に知る価値があります。)

より高度な(Doctorateレベルの)テキスト

  1. Lehmann and Casella、ポイント推定の理論。(ポイント推定のPhDレベルの扱い。この本の課題の一部は、それを読んで、タイプミスとそうでないものを理解することです。あなたがすぐにそれらを認識しているのを見れば、あなたは理解していることがわかります。特に問題に飛び込む場合は、このタイプのものを使用します。)

  2. レーマンとロマーノ、統計的仮説のテスト。(仮説検定のPhDレベルの処理。上記のTPEほど多くのタイプミスはありません。)

  3. A. van der Vaart、漸近統計学。(統計の漸近的理論に関する美しい本で、応用分野についての良いヒントがあります。しかし応用された本ではありません。私の奇妙な表記は、奇妙な表記が使われ、詳細が時々敷物の下に書かれていることです。)


1
@ソビエトの元枢機universities大学には、別の学部統計研究があります。たとえば、ビリニュス大学では、統計学の学士号を取得できます。学生との見方から、興味深い仕事には修士レベルまたは博士レベルの教育さえ必要であることに心から同意します。
mpiktas

1
@ cardinal、@ mpiktas BSで4年+ MSで2年+ PhDで4年は、何か面白いことを学ぶのに10年かかります:) 可能であれば、この素晴らしい答えにを与えます。ほとんどの本は私にとって新しいものです。+
ドミトリーチェロフ

2
@John Salvatier、これらのメソッドはこのテキストではカバーされていないことは正しいです。繰り返しになりますが、特にテキストの主な焦点はアルゴリズムではないので、これは好みの問題だと思います。要するに、あなたの懸念は、序論(13ページ)で著者によって直接扱われています。
枢機

2
@cardinal:スカンジナビアの大学は通常、学士レベルの学位も提供しています。そうは言っても、統計学者は自分自身を少し真剣に考えすぎると思います。「おもしろい」仕事に就くには博士号が必要だとは思わない。科学と研究がますます多くの異なる分野からの研究に学際的な統計が課せられるようになると信じています。インパクトの高いジャーナルに関する記事の半分には、問題の元のコンテキスト/ドメインで与えられた意味をなさないかもしれないが、要求を満たすために、いくつかの疑わしい統計分析があります。
posdef

1
@cardinal Moodの本は、数学の背景を持つ人にとって十分に正式な統計に関する入門書を見つけるのが難しいため、素晴らしい提案でした。この本を読んだ人はいますか?パナテロス、「数学者の統計」springer.com/us/book/9783319283395
イゴールフォビア

11

私はもっ​​と厳格な学校について話すことはできませんが、カリフォルニア大学デイビス校で一般統計学の学士号を取得しています(私の学校で最も厳格です)。厳密さと派生にかなりの依存度があります。実際の分析と線形代数の非常に強力なバックグラウンドを持っているので、数学の博士号は役立ちます-統計の有用なスキル。私の統計プログラムには、基礎(線形代数、実際の分析、計算、確率、推定)をサポートするコースワークの約50%があり、残りの50%は基礎(ノンパラメトリック、計算、ANOVA /回帰、時系列、ベイジアン分析)。
基礎を習得したら、通常、詳細にジャンプするのはそれほど難しくありません。私のクラスのほとんどの個人は、証明と実際の分析に苦労し、統計の概念を簡単に把握しているため、数学の背景から来ることは間違いなく役立ちます。そうは言っても、次の2つのテキストは、統計で扱われている多くのトピックをかなりよくカバーしています。ちなみに、あなたが提供したリンクでは両方とも推奨されているので、あなたの質問とあなたがリンクした質問は必ずしも相関していないとは言いません。

Harald Cramerによる 統計の数学的方法

すべての統計:ラリーワッサーマンによる統計的推論の簡潔なコース


3
+1すべての統計:開始するのに最適な場所です。
サイモンバーン

1
UC-Davisプログラムは見栄えがよく、すばらしい教育を受けることができると思います。他の場所ほど「厳密ではない」とは思わないでしょう。「統合されたBS / MS学位」ページのコメントは興味深く、スレッドに関連していると思いました。「統計学者には高い需要がありますが、 [政府または産業]職場のニーズ。」
枢機

9

英国の王立統計学会は、統計学の卒業証書を提供しています。これは、優れた学士号のレベルです。シラバス、リーディングリスト、過去の論文は、それぞれのWebサイトから入手できます。数学の専門家がこれを使って統計の速度を上げることを知っています。試験を(公式に、またはあなた自身の研究の快適さで)受けることは、あなたがそこにいるときに測定するための有用な方法かもしれません。


3
卒業証書試験は、実質的に最終年度の学部試験です。「ステージング」の目的で、最初に取得できる下位レベルの証明書があります。正確に思い出すと、RSS試験は、香港(独自の統計学会と試験がある)を除き、世界中で利用できます。別の方法は、英国のオープン大学が遠隔教育で提供する統計学の学部卒業証書ですが、世界中で利用できます。これはRSS Grad Dipよりもわずかに低いレベルであるため、その準備と見なされる場合があります。教えられたコースとして、それはかなり高価です。
シルバーフィッシュ

5

上位の統計学学校のカリキュラムWebサイトにアクセスし、学部課程で使用している本を書き留め、Amazonで高い評価を受けている本を確認し、公共/大学図書館で注文します。

考慮すべきいくつかの学校:

MIT OCWやvideolectures.netなどのさまざまな講義ビデオサイトでテキストを補足します。

カリフォルニア工科大学では統計学の学士号を取得していませんが、学士号の統計コースのカリキュラムに従うことで間違いはありません。


1
これは少し奇妙なリストのようです。私の知る限り、カーネギーメロンは、統計上学部の学位を(正式に)提供している唯一の学校です。CaltechもMITも、統計学の大学院プログラムさえ持っていません。
枢機

@枢機卿。なぜ私を疑わなければならないのですか?:)私はそれらの立派な機関の学部学生の統計コースへのリンクを置きました。また、最高の学校のコースを組み合わせて一致させると、悪い学校からの学位の道をたどります。
ニールマクギガン

2
OCWは確かに非常に優れたリソースであり、素晴らしい取り組みです。これは疑う余地がありません。「最高の学校」からのミキシングとマッチングが優れたソリューションであるというあなたの主張に関しては、特に学部の研究では非常に疑わしいと思います。非常にやる気のある学生は、これらの学校のいずれかで非常に良い学部教育を取得する必要がありますが、多くの「悪い」学校で良いかそれ以上の学部教育を見つけることができます。あなたがリストしているような学校は、大学院教育に「勝つ」傾向があります。
枢機

2
実際、これは私が最初に試したものです。質問を投稿する前にこれを試しました。コースのリストを見つけるのは難しくありませんでしたが、実際にそれらのコースに使用された本やそれらの本のどのセクションがカバーされていたかに関する情報を見つけることははるかに困難でした。
ジョンロバートソン

3

SilveyによるStatistics Inferenceを見ました。統計をある程度理解する必要のある数学者が使用しました。それは小さな本であり、権利によって安くあるべきです。http://www.amazon.com/Statistical-Inference-Monographs-Statistics-Probability/dp/0412138204/ref=sr_1_1?ie=UTF8&s=books&qid=1298750064&sr=1-1を見ると、安価な中古品のようです。

それは古く、古典的な統計に集中しています。非常に抽象的ではありませんが、かなり数学的な聴衆を対象としています-演習の多くは、基本的に修士課程である数理統計学のケンブリッジ(英国)卒業証書からのものです。


3

あなたの知識の測定について:あなたのようないくつかのデータマイニング/データ解析コンペ、参加できる1234、そしてあなたが他の人に比べて得点方法を参照してください。

答えには、数学統計に関する教科書への多くのポインタがあります。関連トピックとして追加したい:

  • サンプリング理論、社会人口統計学および地域基準を含む経験的社会調査コンポーネント
  • データ管理(データベースのknowlegdeを含む)(SQLクエリの作成、一般的なデータベーススキーム)
  • コミュニケーション、視聴者が目を覚まし続ける方法で結果を提示する方法(視覚化方法)

免責事項:私は統計学者ではありません、これは私の2セントです


3

ETジェインズ「確率理論:科学の論理:原理と基本アプリケーションVol 1」、ケンブリッジ大学出版局、2003年は、統計のベイジアン側にとって、ほぼ正しいレベルで必読の記事です。私は物事の頻繁な側面のための推奨事項を楽しみにしています(モノグラフはたくさんありますが、良い一般的なテキストはほとんどありません)。


3
良い統計学者、フリークエンティスト、ベイジアンなどになりたい人には必読です。
確率論的

10
ジェインズの本は、このような状況では恐ろしい勧告であることに同意しません:1)表記法がずさんで非標準であり、他の情報源との相互参照を困難にします、2)彼は長く曲がりくねっており、愚かな無関係な議論で行き詰まってしまいます(OPは「最短ルート」を要求しました)3)エラーもあります(周辺化パラドックスなど)
サイモンバーン

1
@Dikran Marsupial、統計的推論に関するシェルヴィッシュのテキストを所有していますか?私はそれを購入するかどうかについてフェンスに縛られていたので、ベイジアンのアプローチにあなたがかなり強く同調しているように見えるので、興味がありました。
枢機

1
私はベイジアンのアプローチに強く同調しているとは言いません。それは私が最もよく理解しているアプローチであり、同じものではありません。本質的に私は心のこもったエンジニアであり、両方のツールをツールボックスに入れて、適切な状態に維持したいのです!各アプローチのメリットとデメリットを適切に理解することを目指します。シェルビッシュの本は持っていませんが、私にとっては非常に欠陥があると思われるベイズ因子に関する彼の論文を読みました(見つけられるかどうかを確認し、誰かに説明してくれる質問を投稿します!)。
ディクランMarsupial

@Dikran、あなたの(潜在的な)質問は面白そうです。私はそれについての投稿を楽しみにしています。
枢機

3

機械学習に焦点を当てたコンピューターサイエンスのバックグラウンドから来ました。ただし、Bishop's Book https://www.microsoft.com/en-us/research/people/cmbishop/#!prml-bookを使用してパターン認識コースを受講した後、統計を本当に理解し始めました(そして適用することがより重要です)

ここにMITからのいくつかのコーススライドがあります:http
//www.ai.mit.edu/courses/6.867-f03/lectures.html

これは、実際の作業の問題に統計を使用するための背景(およびいくつかのmatlabコード)を提供するだけであり、間違いなく適用側にあります。

しかし、それはあなたがあなたの知識で何をしたいかに大きく依存します。あなたがどれだけ良いかを測るには、いくつかの大学のオープンコースウェアで高度な統計コースを参照し、対象のトピックを知っているかどうかを確認することをお勧めします。ちょうど私の5セント。


1

スタンフォードは、柔軟性に関して最高のリソースを提供すると思います。Rでのアルゴリズムの設計に関しては、機械学習コースもオンラインで提供されています。Googleで検索すると、Lagunitaページにリダイレクトされ、興味深いコースがあります。それらは無料です。私はTibshiraniの本、「統計学習入門」と「統計学習の要素」をPDF形式で持っていますが、どちらも非常に優れたリソースです。

あなたは数学者なので、本格的な機械学習を始めたとしても、将来的に非常に役立つと思われる強固な基盤が得られないので、早めに追跡しないことをお勧めします。統計をデータから洞察を得るための数学の枝として扱い、それにはいくらかの作業が必要です。それ以外にも、膨大なオンラインリソースがありますが、ジョンズホプキンスはスタンフォードと同様のものを提供しています。経験は常に有益ですが、立派な資格は常にその基盤を強化します。入力したい特定のフィールドを考えることもできます。それにより、テキスト分析に入ろうとするか、金融の数学と統計のスキルを応用したいかを意味します。私は後者のカテゴリーに属しているので、計量経済学の学位を取得し、そこで金融と統計を学びました。組み合わせは常に非常に良いことができます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.