参照リクエスト:働くデータサイエンティストのための古典的な統計


10

私は、回帰、その他の機械学習タイプのアルゴリズム、およびプログラミング(データ分析と一般的なソフトウェア開発の両方)において確かな経験を持つ、データサイエンティストとして働いています。私の仕事のほとんどは、予測精度(さまざまなビジネス上の制約の下での作業)のためのモデルの構築と、自分(および他の人)の仕事をサポートするデータパイプラインの構築に焦点を当てています。

私は統計学の正式な訓練を受けておらず、大学の教育は純粋な数学に焦点を当てています。そのため、古典的なトピックの多く、特に人気のあるさまざまな仮説検定と推論手法の学習に失敗しました。

私の経歴と経験レベルを持つ人に適した、これらのトピックへの参照はありますか?私は数学的な厳密さを扱い(そして理解し)、アルゴリズムの観点も楽しむことができます。私は、数学とプログラミングの両方(またはいずれか)に焦点を当てた、読者ガイド付きの演習を提供するリファレンスを好む傾向があります。


2
数学のバックグラウンドからの別のマットとして、統計のギャップに満ちた知識があれば、私は関連付けることができます!あなたが興味を持っている特定の分野/アプリケーションはありますか?古典的な統計で注意すべきことの1つは、どのような仮定が使用されているかです。
GeoMatt22

5

回答:


3

Larry WassermanのAll of Statisticsは、数学的統計の旋風ツアーを行うのに最適な本です。自分で使った数学的統計の最初の本でした。仮説検定や最尤推定などの古典が含まれていますが、ブートストラップなどの最近開発されたが同様に重要なトピックも十分にカバーされています。Wassermanは常に統計の片方の足と機械学習の片足を持っています。これは、現代のすべてのデータアナリストがすべきことだと思います。2つのフィールドの1つだけに精通している場合は、多くのことを失うことになります。また、本には多くの優れた演習があります。

実際の分析の背景があり、生の、切り抜かれていないものが必要な場合、つまり確率と統計の測度理論的処理を意味する場合は、Mark J. SchervishのTheory of Statisticsを試してください。SchervishはDeGrootとSchervishの半分であり、あまり専門的ではない本であるProbability and Statisticsは、おそらく今日の数学的統計に関する最も人気のある本です。Theory of Statisticsは、すべての作業を自分で行うことになっている大学院生に通常予約されているトピックについて役立つおしゃべりな本です。正直に言うと、この本は非常に難しいと感じました(ただし、Jun Shaoの数学統計ほど難しくはありません))そして、最終的には、それを習得するために必要な莫大な努力は、応用データアナリストとしての私の時間の有効利用ではないと感じた。しかし、私はまだ多くを学び、メジャー理論が何であるか、そして確率理論へのより単純な従来のアプローチで生じる毛深い理論的困難をクリーンアップするためにそれをどのように使用できるかについて十分理解しました。また、交換可能性と独立性の類似点と相違点を理解するようになりました。


2

心理学者の非常に良い提案は別として(+1)私は観察研究の主題を見ることも勧めます。多くの場合、分析されたデータは観測的な性質のものであるという事実にもかかわらず、それはデータ科学者の間で非常に評価されていない分野だと思います。これは、参考文献(特に生物統計学)の大部分が、少なくともある程度の実験的なデザインがすでに整っていると想定しているためだと思います。ポール・ローゼンバウムの本「 観察研究」「観察研究の設計」は、最も一般的に使用される参考文献の一部です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.