確率論、測度論、そして最後に機械学習について学びたいです。どこから始めますか?[閉まっている]


9

確率論、測度論、そして最後に機械学習について学びたいです。私の最終的な目標は、ソフトウェアで機械学習を使用することです。

私は大学で微積分と非常に基本的な確率を勉強しましたが、それだけです。これらの科目について学ぶために使用できるオンラインコースや書籍を知っていますか。私はウェブ上で多くのリソースを見つけましたが、それらはすべて専門家の読者を対象にしているようです。時間がかかることはわかっていますが、最初から学びたい場合はどこから始めればよいですか。



2
これら3つの質問は、@ Generalによってリストされた重複によってかなりカバーされているようです。
whuber

回答:


13

私はあなたのために2つの非常に良い人気のある参考文献があると思います(私はこれらのものから始めて、保険数理学の修士号を持っています):

  1. Gareth James、Daniela Witten、Trevor Hastie、Robert Tibshiraniによる統計学習入門(Rでのアプリケーションを使用)。それはサイトで自由に利用可能で、実用的な例でかなり包括的で理解しやすいです。非常に強力な統計的背景がなくても、多くのことを学ぶことができます。このリファレンスは、さまざまなプロファイルに役立ち、数学的詳細に深く踏み込むことなく、Rでの実装とともに十分な数の一般的なアルゴリズムを含みます。

  2. トレバー・ハスティー、ロバート・ティブシャーアーニ、ジェローム・フリードマンによって統計的学習の要素。最初のものと比較して、この本は、あなたがあなたのために役立つと思う特定のアルゴリズムについてさらに探求したいなら、数学的な側面をより深く掘り下げます。(これも無料です

そしてもちろん、相互検証済みは、私にとって多くのことを学ぶことができる最高の情報源の1つです:最高の評価、統計の誤解と誤用など。学校/大学での学習とseft-learningを数年間行った後、初めてCross Validatedに行ったとき、私の知識は制限されていることがわかりました。私は最初の訪問以来、毎日ここに行き続け、たくさんのことを学びます。


3
これらの参考文献が気に入った場合は、スタンフォード大学のオンラインコースに注意してください。T. HastieとR. Tibshiraniは、機械学習関連のコースを頻繁に提供しています。
Marcel10

Rでのアプリケーションを使用した統計学習の概要の約20%を読みました。これがまさに私が探していたものです。素晴らしい本であり、かなり理解しやすい。どうもありがとうございます!:)
最大

6

ここでは、私が強く推奨していると聞いた無料のオンラインコースをいくつか紹介します。

  • http://projects.iq.harvard.edu/stat110/home (現在の確率論の快適さに依存します。ブリッツスタイン博士のコースは、統計/確率に詳しくない人でもハーバードで非常に人気になりました。私は見ました私自身のレビューのためにいくつかの講義を行い、それらは非常に役に立ちました。
  • https://www.coursera.org/learn/machine-learning(これは、Coastraの共同設立者となったAndrew Ngによるスタンフォード初の大規模オンラインコースの最新バージョンです。このコースを受講するつもりでした。 、しかし時間がありませんでした。)

5

メジャー理論は必要ありません。メジャー理論は、数学者が他の数学的手順を正当化するために使用します。ほとんどのエンジニアは測定理論を研究せず、単に結果を使用します。MLに必要な数学の知識は、多変量ガウスを統合できることでおおまかに特徴付けられます。これに自信がある場合は、多変数計算、線形代数、確率理論の背景が必要になる可能性があります。

アレン・ダウニーのThink Statsをお勧めします。これは、プログラマーに確率/統計を教えることを目的としています。アイデアは、プログラミングの専門知識を活用してシミュレーションを実行し、それにより確率論/統計的手法を理解することです。 アレンダウニーブログ(彼は他にも書いています) 統計(無料)pdfを考えてください


4
(F,Ω,P)

@Aksakalは私の考えでは継続的なプロセスだけではありません!
Metariat

5

機械学習に興味があるので、確率と測定をスキップして、MLに直接ジャンプします。Andrew Ngのコースは、出発点として最適です。文字通り2週間で終了できます。

数週間学んだことを試してから、根に戻っていくつかの確率を調べてください。あなたがエンジニアなら、大学でどのようにしてスキップしたのか困惑しています。それはかつて工学の必須コースでした。とにかく、ここで MIT OCWコースを受講すれば、追いつくことができます

測定理論は必要ないと思います。メジャー理論は必要ありません。そうする人々は、彼らがここに来て質問することはありません。彼らの顧問が彼らにどのコースを取るべきかを教えるからです。アドバイザーがいない場合は、絶対に必要ありません。トートロジー、しかし本当です。

メジャー理論のあるものは、「読みやすさ」では学べないということです。演習と問題を実行する必要があります。基本的には、難しい方法で実行します。私の意見では、それは教室の外では事実上不可能です。ここでの最善の選択肢は、地元の大学でクラスを受講することです。PhDレベルの確率コースでは、1つのクラスで測定と確率を行う場合があります。本当に自分を拷問したくないのでない限り、数学部門で純粋測定理論のクラスを取ることはお勧めしませんが、最終的には大満足です。


2

機械学習について、Peter FlachによるMachine Learning:The Art and Science of Algorithms Sense of Data of Senseを最初に参照するのに適したリソースになると思います。直感的な例を使用して機械学習の概要を説明し、初心者に適しています。機械学習の実験を扱う最後の章のために、私はこの本が特に好きです。機械学習について学びながら、さまざまなモデルを理解するだけでは不十分であり、さまざまな機械学習アルゴリズムを比較できるはずです。この本はそれらのアルゴリズムを比較する方法を理解するのをより簡単にしたと思います。講義用スライドはここにあります


2

上記の優れた提案に加えて、確率と統計のより基本的な概念をしっかりと把握することに興味がある場合、「アルゴリズムからZスコアへ:統計における確率的計算」は、コンピュータを使用して確率論と確率過程における最も重要な初心者/中級者の概念のいくつかを理解する。また、機械学習(ML)の紹介として、「統計学習の紹介」または「統計学習の要素」(ESL)の2つ目も紹介します。ESLは特に素晴らしいと思いますが、MLの概念を数学的に詳しく見ていく必要があるため、統計で「大丈夫」とだけ考える場合は、詳細を理解したら、それを読んでもらいたいかもしれません。 MLの経験。

採用や問題解決のために機械学習に興味がある場合は、実践的な経験を積むことが重要です。データサイエンス/機械学習コースの概要を説明します。Andrew Ngは、こちらの Coursera でのコースで機械学習のすばらしい紹介をしています。また、いくつかのデータセットをダウンロードして、それらをいじってみることをお勧めします。まだ行っていない場合は、RとRStudio(私の意見では、PythonやMatlabよりも初心者に優しい)をダウンロードし、kaggleにサインアップして、初心者の問題のいくつかを実行します。彼らには、基本的に実際に何が起こっているのかわからないままMLを使用できる素晴らしいウォークスルーがありますが、実際にMLソリューションを実装するために必要な手順の種類についてのアイデアを提供します。

個人的には、実際にMLツールを使用することの組み合わせを推奨します(実際には、Kaggleデータセットなどを使用して)。そして、相互検証、オーバーフィッティング、混同行列の使用、モデルの良さのさまざまな測定値などの基本的な概念を学びます。私にとって、アルゴリズムの使用方法を理解し、物事が機能しているときに特定する方法を理解することの方がはるかに重要です/アルゴリズムがどのように機能するかを理解するためではなく、機能していない。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.