データマイニングと機械学習の準備として、どのような数学の科目を提案しますか?


30

私は、データマイニングと機械学習の学習に備えるために、自主的な数学のカリキュラムをまとめようとしています。これは、Andrew Ngの機械学習クラスをCourseraで開始し、先に進む前に数学のスキルを向上させる必要があると感じたことがきっかけです。私は少し前に大学を卒業したので、私の代数と統計(特に政治学/心理学のクラスから)はさびています。

スレッドの回答数学の強力なバックグラウンドはMLの必須条件ですか?機械学習に直接関連する書籍またはクラスのみを提案します。私はすでにそれらのクラスと本のいくつかを調べましたが、どの数学の研究対象かを正確に知りません(たとえば:数学のどの分野が「コスト関数を最小化する」方程式を導き出しますか?)。提案されているもう1つのスレッド(スキルとコースワークはデータアナリストである必要があります)は、データの分析に必要なスキルの幅広いカテゴリのみに言及しています。私はまだ数学の学位を持っていないのでスレッド「数学者のための統計入門」は当てはまりません。同様のスレッド数学者は、同等の知識を質の高い統計学の程度に望んでいます 統計書の信じられないほどのリストを持っていますが、再び、私は代数のさびた思い出から数学を始めて、そこから上に向かっているのを見ています。

それで、機械学習とデータマイニングで働く人にとって、仕事をするために数学のどの分野が不可欠だと思いますか?データマイニングと機械学習の準備として、どのような数学科目を、どのような順序で提案しますか?ここに私がこれまでに持っているリストと順序があります:

  • 代数
  • 事前計算
  • 微積分
  • 線形代数
  • 確率
  • 統計(ここには多くの異なるサブフィールドがありますが、それらをどのように分割するかわかりません)

データマイニングと機械学習については、現在の仕事を通じて、ウェブサイト/アプリのアクティビティ、顧客/サブスクリプショントランザクション、および不動産データ(静的および時系列の両方)の記録にアクセスできます。これらのデータセットにデータマイニングと機械学習を適用したいと考えています。

ありがとうございました!

編集:

後世のために、Geoffrey Gordon / Alex Smolaの機械学習入門で役立つ数学の自己評価を共有したかった CMUのクラスでです。


3
Courseraクラスの前提条件に関しては、その情報は資料のどこかで入手できるはずです。彼らのクラス/より一般的には、stat / ML / DMに必要な数学の質問は重複しているように思います。:CV、カバー上の複数のスレッドが、この材料には、存在するため-ML-強いバックグラウンド・イン・数学・-必須-で、&スキル・コース-必要-に被-データアナリスト(おそらく)。
GUNG -復活モニカ

1
それらのスレッド、そこにリンクされているスレッドを密接に関連するものとしてレビューし、おそらくサイトを検索してください。読み直してもまだ質問がある場合は、ここに戻ってこのQを編集して、他の記事で説明されていないことを知っておく必要があることをより明確に指定/特定してください。
GUNG -復活モニカ

回答:


15

@gungの提案は確かにフォローアップする価値があります。もちろんコースを終えたので、あなたのリストは良いスタートだと思います。いくつかのコメント:

  1. 線形代数と行列代数は同じものなので、後者を削除します。
  2. 微積分では、必ず偏微分を含めてください。これは、複数の変数の関数に適用される計算です(たとえば、z の関数です バツ そして y あなたが欲しい zバツ のではなく dzdバツ)。幸いなことに、これは難しくありません。
  3. 微積分学では、基本的な統合を超えるものは必要ありません(そして、それさえないかもしれません)。統合が難しいため、これは幸運です。
  4. 基本的な最適化を追加します。つまり、関数(通常は複数の変数の関数)の最大値または最小値を見つけます。少なくとも勾配降下の評価は不可欠です。
  5. 難易度の観点からは、おそらく学部1年生の最初から最後までのどこかになりたいと思うでしょう。
  6. オンラインまたはその他の方法で、基本的な確率と統計のテキストを読みますが、あまり心配しないでください(確率と統計を理解するには、基本的な数学が前提条件です)。あなたが提案するようないくつかのコースをするなら、あなたは何を学ぶ必要があるか、そしてあなたの興味がどこにあるかを理解するでしょう。少なくとも最初はしたくないことの1つは、仮説検定について多くの時間を学ぶことです。むしろ、基本的な統計(ランダム変数、確率分布(PFD、CDF)、記述統計)の理解に向かって進み、その後、回帰を理解してみてください。

5

など、このforum--に優れたスレッドのカップルがありますTHIS ONE私はデータ科学の仕事のための重要なスキルの概念の輪郭を開発するという点で私のために特に有用で発見したことは。

上記のように、多くのオンラインコースが利用できます。たとえば、Courserには現在、データサイエンススペシャライゼーションがあり、作業に必要なツールのいくつかをおそらくカバーする多くのコースがあります。


3

機械学習/データマイニングをまとめたい場合は、最適化/線形代数/統計および確率を強くお勧めします。これが確率の本のリストです。お役に立てば幸いです。


3

非常に基本的な数学のスキルを磨く限り、私はこれらの本を使用しています:

経済学と金融のための数学の要素。Mavron、Vassilis C.、Phillips、Timothy Nこの本は、偏微分、統合、行列と行列式、および最適化に関する小さな章、および微分方程式まで、基本的な数学スキル(加算減算)をカバーしています。それは経済学と金融を対象としていますが、それは小さな本です、章のシーケンスは私のニーズに合っていて、私にとって読みやすいです。

統計分析:Microsoft Excel2010。ConradCarlbergは、基本的な統計分析、重回帰、および共分散分析をカバーしており、Excelを使用しています。

R. Andy Field、Jeremy Miles、ZoëFieldを使用した統計の発見。まだ読んでいない。Rを使用します。

初等線形代数。ロンラーソン、デビッドC.ファルボ。

行列法:線形代数の適用リチャードブロンソン、ガブリエルB.コスタ。初等線形代数と行列計算をカバーします

これらは、データマイニング/機械学習に関連して使用する基本的な数学の本です

お役に立てれば


3

ここには、いわゆる「オープンソースデータサイエンスマスター」にリストされている(および分類されている)関連リソースがかなりあります。

特に数学については、それらをリストします:

  1. Linear Algebra & Programming
  2. Statistics
  3. Differential Equations & Calculus

Pretty generic recommendations, although they do list some textbooks that you might find useful.


2
  • 確率と統計が不可欠です。いくつかのキーワードは、仮説検定、多変量正規分布、ベイズ推定(結合確率、条件付き確率)、平均、分散、共分散、Kullback-Leibler発散などです。
  • 基本的な線形代数は機械学習に不可欠です。学習できるトピックは、固有値分解と特異値分解です。(もちろん、行列積の計算方法を知っている必要があります。)
  • TooToneがすでに述べたように、最適化は重要です。勾配降下法を知って、ニュートンの方法、Levenberg-Marquardt、Broyden-Fletcher-Goldfarb-Shannoを見てください。
  • 微積分はそれほど重要ではありませんが、関数の偏導関数(ヤコビ行列、ヘッセ行列など)の計算方法を知ることは有用であり、積分とは何かを知っておく必要があります。

0

Linear Algebra, Stats, Calculus. I think you can learn them in tandem w/ ML - or even after the basics. The starter courses / books do a great job with math primer chapters, and you learn the math essentials while learning ML. I made a podcast episode on the math you need for machine learning, and the resources for learning them: Machine Learning Guide #8


0

Before Starting any machine learning course go through following mathematics course. Also don't try to dig in single attempt. Learn basic concepts then again brush-up your mathematics skills and repeat:-

Mathematics Topics are as following:-

  • Linear Algebra
  • Probability
  • Basic Calculus
  • Maxima and minima of function
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.