数学の強力なバックグラウンドはMLの必須条件ですか?


37

私は自分のスキルセットを向上させたいと考え始めており、私は常に機械学習に魅了されてきました。しかし、6年前にこれを追求する代わりに、コンピューターサイエンスとはまったく関係のない学位を取ることにしました。

私は約8〜10年間ソフトウェアとアプリケーションを開発してきたので、私は良いハンドルを持っていますが、機械学習/確率/統計学の数学の側面に侵入することはできないようです。

私は学習教材に目を向けると、最初のページには混乱を招き、すぐに学習に障害を引き起こすものが含まれている可能性があります。

  • 数学の強力なバックグラウンドはMLの必須条件ですか?MLを続行する前に、数学の空白を埋めてみる必要がありますか?自己学習は、ハードコンピュータサイエンスのバックグラウンドがなくても、開発者だけで本当に機能しますか?

関連する質問:


4
少なくとも線形代数を非常によく理解する必要があり、おそらくベイズのアプリケーションの確率もある程度必要だと思います。また、数学をコードに快適に変換する必要があります。また、表記規則に合わせて適応できる必要があります(これはまったく一貫していません)。MLは、ほとんどのコンピューター科学者にとっても簡単ではありません。
ジョンモーラー

3
質問がまったく関連しているとは思わない。これを非常に魅力的なstackexchangeサイトにして、質問を閉じてくれてありがとう。私に本を勧めてくれる人は誰もいませんでした。これは、「重複する可能性」に基づいて、重複していない
Layke

2
メタ(8時間前)でスレッドを作成して、これを再度開くように求めました。meta.stats.stackexchange.com/questions/1442/...
ダグラスZare

1
ありがとうございました。「あまりにも主観的」または「実際の質問ではない」として閉じられる可能性がありますが、それは間違いなく重複ではありません。
レイク

1
Laykeは、@Douglas Zareによって開始されたメタスレッドで説明したように、私たちは、あなたがこの質問に潜在的な終了を検討願う好意を、それはすぐにあなたがおそらく既にあなたの質問に答える関連のスレッドにアクセスすることができますので、あなたに。しかし、あなたはそれが重複することを意図していないとコメントしているので、このサイトで同様の質問を重複させないという意味でそれを明確にするためにあなたの質問を編集してください。それを再開させていただければ幸いです。
whuber

回答:


23

Stanford(Ng)Caltech(Abu-Mostafa)は、YouTubeで機械学習クラスを開催しています。あなたは課題を見ることができませんが、講義はそれらに依存しません。それらを学習する必要がある数学を見つけるのに役立つので、それらを最初に見ることをお勧めします。私は、CourdraのAndrew Ngによって、割り当てのある非常によく似たクラスが教えられていると信じています。

1つの例外:スタンフォード大学の講義の初期に正しく思い出せば、Ngは行列の生成物の痕跡の導関数を含むいくつかの計算を行います。それらはかなり孤立しているので、これらの計算に従わなくても心配しないでください。どのコースがそれらをカバーするかさえ知りません。

確率、線形代数、線形計画法、および多変数計算にある程度精通している必要があります。ただし、これらの科目の多くの完全な大学のクラスに含まれているものよりもはるかに少ない必要があります。



15

アプリケーションの種類によっては、MLプラクティショナーとして必ずしも多くの数学を必要とするわけではありません。

独学のプログラマー(〜15年)であり、数学(計算III)や統計のバックグラウンドがあまりない大学を頻繁に中退したため、私はいくつかのリソースで機械学習/データマイニングを開始しました。

  • BerryとLinoffの著書「Mastering Data Mining:The Art and Science of Customer Relationship Management」

  • 同じ著者による本「Data Mining Techniques」

  • R、特にパッケージパーティーとnnet

私はマーケティングと運営をサポートする非営利団体で働いています。特に最初は、主にダイレクトメールのアピールにデータマイニングを使用しました。

その後、CSUで線形代数、Andrew Ngの機械学習、統計的手法の紹介(STAT 301)などを受講しました。

Andrew Ngの2冊の本から始めることをお勧めします。アプリケーションに応じて、決定木(Rのパーティーパッケージ)をお勧めします。


9

これは実際には良い質問であり、非常に話題性が高いと思います。しかし、答えがあるかどうかはわかりません。最近の記事は、データサイエンスがオンラインで習得しやすいことを示唆することで、多くの論争(ここを参照)をかき立てました。ただし、その記事で言及されているほとんどのケーススタディの注目すべき点は、それらが保険数理または数学の背景に由来していることです。

Coursera、Stanford、edXなどのオンラインコースは必要な特定のコンピューターサイエンススキルを教えるのに役立ちますが、適用するモデルが何をしているかを理解するには数学的背景が不可欠である可能性が高いため、これは興味深い点です。一方、これらの人たちはすべて分析的に最初からやりたいと考えているという同様に強力な議論をすることができます。これが彼らが定量的分野で働く理由であり、機械学習を簡単に取り入れて競争に勝った理由でもあります。

私は根本的に、ここで起こっている分析問題のレベルがあると思います。数学のスキルは、適用するアルゴリズムの確率論的根源を理解するのに役立つ場合がありますが、優れたソフトウェアエンジニアリングスキルを使用すると、高度な分析を行い、アルゴリズムの一部をまとめることができるため、同じくらい追加できるという議論がありますなぜ彼らがそれをしているのか完全に理解していない場合でも、あなたの目標を達成する。一般に、データサイエンス(および関連による機械学習)は、まさにこの幅のためにエキサイティングなフィールドです-あなたはデータベースの男であり、問​​題を解決するためにブルートフォースを使用することができますさまざまなアルゴリズムとアプローチを最適な方法でまとめるコード。

予測に追加するアプローチはすべて良いので、数学を学ぶことは、この分野で成功するための最良のチャンスを与えるための良いアイデアかもしれません。良い出発点が必要な場合、MITには優れた線形アプリケーションがあり、わかりやすい計算アプリケーションがいくつかあります。また、確率論的プロセスと多変数計算に関する他のコースもあり、これらはあなたの知識を構築するのにも興味があるかもしれません。


数学を単純化しても、分析に関心のない人々(または非抽象的または貧弱な抽象化者)が本当に助けにならないことは、常に私を心配しています(+1)。また、Strang線形代数コースが好きでしたが、線形代数はブルートフォース計算によって食われる最初の数学ではありませんか?データサイエンスは簡単なリンクであるため、おそらく誰かがすでに調達していますが、偽の株式市場の競争では、1000人以上の成熟者の1または2が大抵専門家を破るでしょう-だれでもリックピッキング株を得ることができます!
パネロン

4

数学の強力なバックグラウンドはMLの必須条件ですか?–統計であると概念化されたMLに対する回答と推測;-)

1990年頃、私はコンピューター代数が助けになることを望んでいましたが、それはそうだと思いますが、かなり限られています。しかし、それは確かに数学の学習をスピードアップするのに役立ちます(練習によって操作スキルを開発する必要がなく、単純な演習を行うことができるだけでうまくやろうとします)。私は、Fred SzaboのMathematicaを使った線形代数がこれの優れた例であることに気付きました(しかし、すでに高度な理論レベルの線形代数のコースを受講していました)。

私は1988年から(統計から定理と原理を「具体化する」コンピューター集中法を利用して-正確に)答えを必要としないか、少なくとも不要にするために働いています。数学のスキルと理解を追加することで、常により速く、より一般的に理解できるようになります。近づき始めていると思いますが、確率を生成するモデルと推論の操作可能な表現が必要であり、それは単なるおもちゃの問題以上に有効有用です。

MLを続行する前に、数学の空白を埋めてみる必要がありますか?

それは大変な努力です。MHOでは、統計を理解するほとんどすべての人が、標準操作するのが非常に快適であり、特に確率生成モデルの数学表現と推論の数学特性(数学統計Phdsの上位x%)を操作することでそこに行きました。ですから、基本を習得するだけでなく、数学に本当に慣れているということです。(余談ですが、私にとってはフーリエ理論が不可欠でした。)

これらの表現が難しいのはなぜですか(数学がたくさんある場合でも)。

ゲルト・ギゲレンツァーは、_自然周波数を使用したテストの正/負の問題を考えると、単純な疾患の正/負の問題はないということをほぼ確立しています。リンクされた質問からの参照は、http://www.autonlab.org/tutorials/prob18.pdfをうまく利用しているようです

なぜこれを一般化するのが難しいのですか?

k回のテスト(繰り返しまたは異なる)– 2 ^ k

v値を取るテストの場合– v ^ k

したがって、バイナリ不明の場合– 2 * v ^ kサンプルパス確率

pの場合、複数のバイナリ未知数2 ^ p * v ^ k

p個の有理数の未知数Q ^ p * v ^ k

これに対処するために、数え切れないほどの数え切れないほどの無限大を使って数学に素早く移動します。

さらに、線形から非線形の危険な誤解(たとえば、非情報の事前確率を指定することの隠れた危険、事前分布に関する情報のないその他のMCMC)、相互作用、ランダム効果などがあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.