私は統計や高度な数学のバックグラウンドを持たないコンピューターサイエンスエンジニアです。
私は、ラシュカとミルジャリリの著書「Python Machine Learning」を勉強していますが、機械学習の数学を理解しようとしたとき、友人が私に示唆する統計学習の素晴らしい本を理解することができませんでした。
機械学習の簡単な統計と数学の本を知っていますか?そうでない場合、どのように移動する必要がありますか?
私は統計や高度な数学のバックグラウンドを持たないコンピューターサイエンスエンジニアです。
私は、ラシュカとミルジャリリの著書「Python Machine Learning」を勉強していますが、機械学習の数学を理解しようとしたとき、友人が私に示唆する統計学習の素晴らしい本を理解することができませんでした。
機械学習の簡単な統計と数学の本を知っていますか?そうでない場合、どのように移動する必要がありますか?
回答:
本が必要ですが、機械学習やデータサイエンスの他のタスクに使用される統計を理解するには、それぞれ次のコースをお勧めします。彼らは無料です。
本を推薦したい場合は、CCライセンスの下で無料で入手できる次の本をお勧めします。良い例があり、とても実用的です。さらに、現実世界の例で統計を感じるのに役立つコードがたくさんあります。
また、次のリンクが役立つ場合があります。
線形代数の概要https://math.mit.edu/~gs/linearalgebra/は出発点として適切です。確率論、線形代数、統計学に精通していることを確認してください。非常に深い知識は必要ないかもしれませんが、良い知識を持つことが必要です。
アナリティクスの修士号を取得する前に、先輩から機械学習と統計の詳細を知るためにこれらの本を読むよう勧められました。
すなわち:
これらの書籍をオンラインで見つけられない場合は、リンクを共有することを教えてください。ドライブに保存しています。これらの本は、素人の言葉で説明された例で統計の基本を理解するのに役立ちました。
いくつかのオンラインコースをお探しの場合は、いくつかの優れたコースを提案できます(ほとんどは無料です)。
私はあなたの質問から、あなたが数学にどれだけ熟達しているか、あなたの学習がどこで止まるかを話すことができません。あなたはコンピューターソフトウェアエンジニアであるため、代数、幾何学、そしておそらく微積分に精通していると思います。
統計を読み、説明、探索的データ分析、相関、分布などの概念を理解することから学習を始めることをお勧めします。ビデオよりも本の方が好きだと思うので、途中でお会いして、オンラインで入手できる本を数冊と、印刷物で購入できる本を1冊または2冊提供します。
まず、ペンシルベニア州の統計学のオンライン大学院コースカリキュラムをお勧めします。左側のメニューを使用して、各コースを探索できます。コースを選択したら、コースのWebページを下にスクロールし、「オンラインコースノート」と表示されているリンクをクリックします。これらのコースのコースノートは、ノートよりもはるかに多く、完全な本のように読みます。彼らは非常に有益です。また、高度な大学院課程で何かを見つけて「より簡単な」説明が必要な場合は、ペンシルベニア州立大学のオンライン学部課程の統計もご覧ください。
第二に、ジョンH.マクドナルドによる生物学的統計ハンドブックを確認します。タイトルにだまされないでください。この本は、あらゆるドメインに適用可能な統計とデータ分析の優れた入門書です。
第三に、Gerard Dallal によるThe Little Handbook of Statisticsをレビューします。繰り返しますが、タイトルにだまされないでください。この本は、統計に関するいくつかの重要な基本事項を説明する別の逸品です。
4番目に、アレン・ダウニー著 『Think Stats』をご覧ください。以前の版のオンライン無料版があります。購入しなければならない最新版。ただし、特にPythonで作業している場合には価値があります。この本では、著者はPythonを使用して実際の(おもちゃ)データセットを分析する統計とデータ分析を教えています。これは本当に素晴らしい本です。
最後に、Joel GrusによるScratchのData Scienceをご覧ください。この本は(統計の基礎ではなく)データ分析に焦点を当てており、機械学習とモデリングに重点を置いています。Python(およびPythonデータサイエンススタック)を使用して、実際の(おもちゃ)データセットの予測分析を分析および実行します。仕事をするもう一つの素晴らしい本。
私は応用統計学の修士号を持っていますが、非常に簡単な答えを提供することを心に留めておいてください:確率のコースを受講してください。
最新のMLプログラミングフレームワークのほとんどは、データサイエンスから大部分の数学を取り除いています。ほとんどのシナリオでは本当に必要ありません。ただし、結果を理解する能力は常に必要であり、結果の大部分は確率で表されます。データサイエンスが初めての場合は、確率に関する(簡単な)コースを受講し、割合と割合が実際に何を意味するのかを理解し、フレームワーク(Tensorflowなど)を本当によく理解するように努めます。それができれば、本当に面白いアルゴリズムを書くことができ、数学に執着する必要はありません。