機械学習アルゴリズムに必要な確率の基礎を学習する最良の方法は何ですか？

13

数年前に大学で確率コースを受講しましたが、今は機械学習アルゴリズムをいくつか試しているので、数学の一部が混乱しています。

具体的には今、EMアルゴリズム（期待値の最大化）を学んでいますが、必要なものと持っているものとの間に大きな隔たりがあるようです。

私は本やウェブサイトを求めているわけではありませんが、これらのトピックを十分に学習して、それらを使用するアルゴリズムを完全に理解する方法は何ですか？本を読んで何百ものエクササイズをする必要がありますか？それとも、この意味でやり過ぎですか？

編集：これがこの質問の間違った場所である場合、移行するために投票してください:)

probability machine-learning

— コーヒー
ソース

CVを認識していませんでした！質問をそこに移行する方法はありますか？

2

移行に投票しました。:)

— JMは統計学者ではありません

何かを学ぶ最良の方法は、それを小さな断片に分割することです。このサイトで、あなたを悩ませている1つまたは2つの特定の質問または概念について質問してみませんか？

— charles.y.zheng

6

機械学習の書籍とオンライン紹介の多くは、コンテンツ内で必要な確率を少し紹介しているので、そのような種類の書籍を1つか2つから始めます。私の頭の中で、統計的パターン認識（EMをそこで学んだからかもしれません）と統計的学習の要素について考えることができます。

私の本当のアドバイスは、Andrew MooreによるStatistics Data Mining Tutorialsです。これは、博士号を取得する前に私が持っていたギャップを埋めたサイトでした（エンジニアリングのバックグラウンドから来ました）。あなたがウェブサイトについて尋ねているのではないと言っていることは知っていますが、あなたが決める前に、そこのData Minersの確率と他の確率スライドを見てください。EMのガウス混合モデルをご覧ください。

本を読んで何百ものエクササイズをする必要がありますか？

そうは思いません。機械学習における確率の計算は、いくつかのよく知られたパスを中心に集中する傾向があります。ガウスの単一および多次元分布をしっかりと把握し、EMのいくつかの説明を勉強することで、かなり遠くまで行くことができます。そして、線形代数。多くの線形代数が必要になります。

— ムハンマド・アルカロリ
ソース

-3

人工知能は過去10年間で重要性を増しており、その多くは日常生活におけるAIの開発と統合に依存しています。AIがすでに行った進歩は、自動運転車、医療診断、さらにはGoやChessなどの戦略ゲームでの人間の賭けにも驚異的です。

AIの未来は非常に有望であり、私たち自身のロボット仲間がいるときからそう遠くありません。これにより、多くの開発者がコードの記述を開始し、AIおよびMLプログラムの開発を開始するようになりました。ただし、AIとMLのアルゴリズムを書くことを学ぶのは簡単ではなく、広範なプログラミングと数学的知識が必要です。

数学は、これらの2つのストリームのプログラミングの基盤を構築するため、重要な役割を果たします。

機械学習にとって数学が重要な理由はたくさんあります。それらのいくつかを以下に示します。

正確性、トレーニング時間、モデルの複雑さ、パラメーターの数、特徴の数を考慮することを含む適切なアルゴリズムの選択。パラメータ設定と検証戦略の選択。バイアスと分散のトレードオフを理解して、不足フィットと過剰フィットを特定します。適切な信頼区間と不確実性の推定。

機械学習にはどのような数学が必要ですか？

機械学習または人工知能の研究には数学が絶対に必要です。MLの概念とアルゴリズムをさらに深く理解するには、数学の基本的な知識が必要です。

3つの主要な数学理論：線形代数、多変量計算、および確率理論。

線形代数–

線形代数表記法は、機械学習でさまざまな機械学習アルゴリズムのパラメーターと構造を記述するために使用されます。これにより、線形代数は、ニューラルネットワークがどのように組み立てられ、どのように動作するかを理解する必要があります。

次のようなトピックが含まれます。

スカラー、ベクトル、行列、テンソルマトリックスノルム特殊行列とベクトル固有値と固有ベクトル多変量計算–

これは、機械学習の学習部分を補完するために使用されます。これは、例から学習し、異なるモデルのパラメーターを更新し、パフォーマンスを改善するために使用されます。

次のようなトピックが含まれます。

微分積分勾配微分演算子凸最適化確率理論–

理論は、これらのディープラーニングまたはAIアルゴリズムを設計する際に、基礎となるデータに関する仮定を立てるために使用されます。重要な確率分布を理解することは重要です。

次のようなトピックが含まれます。

確率の要素確率変数分布分散と期待特別な確率変数機械学習のための数学を素早く学習するには？

データサイエンスのための数学を学習する自発的な方法は、「たわごとをする」ことによって学習することです。それでも、基礎となる理論を前もって学習または確認する必要があります。教科書全体を読む必要はありませんが、最初に重要な概念を学びたいでしょう。

柔らかい前提条件として、線形代数/行列計算（したがって、表記法にとらわれないようにする）と導入確率の基本的な快適性を想定しています。

機械学習の数学を深く学びたい場合は、次のようなオンラインで利用できるコースがn個あります。

カーンアカデミーの線形代数、確率と統計、多変数計算、最適化。

eduonixの機械学習とAIの数学的基礎

udemyで機械学習の数学を学ぶ

マトリックスのコーディング：ブラウン大学のフィリップクラインによるコンピューターサイエンスアプリケーションによる線形代数。

ラリーワッサーマンの本—すべての統計：統計的推論の簡潔なコース。

行うことで最高の学習ができることを忘れないでください。悲しいことに、これらのコースには十分な課題と宿題が含まれていません

私がお勧めするのは、機械学習とAIのためのMathematical Foundationです -このコースは完全な数学カリキュラムではありません。学校や大学の数学教育に取って代わるものではありません。代わりに、機械学習の研究で遭遇する重要な数学的概念に焦点を当てています。

学習内容：

その他多数……

このコースの最後には、独自のアルゴリズムを構築するための知識だけでなく、次のプロジェクトで使用するアルゴリズムを実際に開始する自信もあります。

このコースには、数学の概念に関する知識を強化するためのプロジェクトとクイズも含まれています。

正式な教育の一環としてこれらの重要な概念を見逃した学生、または数学の勉強から長い休みの後に思い出をリフレッシュする必要がある学生のためのギャップを埋めるように設計されています。

このコースは、最初から2〜3か月かけて資料をざっと読んでから、出会うまでに学んだことの半分を忘れるよりもはるかに優れていると思います。

示されている基本概念を理解し、常に楽しんでください。

— リチャード・スミス
ソース