数学博士(非線形プログラミング)からデータサイエンスへの切り替え?


9

私は数学の博士号を取得しています。卒業後、データサイエンティストとして業界に行きたい学生。質問をする前に、私の教育の背景を簡単に説明し、理解を深めます。

数学コースワーク:

これは主に純粋な数学で行われました:トポロジー、機能分析などですが、より多くの応用されたもの(私が論文に特化したもの)も含まれます:凸最適化、非線形プログラミング、数値解析、線形プログラミング、多目的最適化。また、現時点では推論統計の知識はありませんが、確率論には自信があります。

プログラミング:

私は学士号で1年のコースを受講したばかりですが、それはほとんどMathematicaといくつかのJavaでしたが、正直なところ何も覚えていません。このコースの内容には、データ構造やアルゴリズムの設計と分析、データベース管理システムは含まれていません。また、学士論文でアルゴリズムを実装するために自分でMatlabを学びました。

上記の背景は、学士号と修士号のプログラム中のものです。今、博士号の間 プログラムでは、機械学習が非線形最適化、プログラミング、および現実世界のアプリケーションの間の(私にとって)完璧な組み合わせであることを発見しました。つまり、機械学習は理論的に興味深く、アプリケーション指向です。これが私が産業界に行くことにとても興奮した理由です。したがって、私は過去3年間で、自分のことを(少しの自由な時間に)自分で学び始めました。

学んだことの短い要約:

  • Python:最適化アルゴリズムを実装し、jupyterノートブックとnumpyライブラリを操作し(実際、論文のためにこれを行わなければなりませんでした)、パンダで基本的なデータ操作とクリーニングタスクを行うことに慣れています。これは、dataquest(https://app.dataquest.io)というプラットフォームでオンラインで学びました。ただし、データ構造とアルゴリズムのインタビューに合格するための十分な知識がないと思います(上記を参照)。

  • 機械学習:私は大学のトピックのマスターレベルのコースを受講しました(私はドイツにいるため、博士課程にはコースがないので、これはすべて私の個人的な時間でした)、それは本当に楽しかったです。含まれるトピック:k-NN、PCA、SVM、NNなど

  • 今学期のデータベースのコースは、SQLに焦点を当てています。

  • 今学期は、Courseraのディープラーニング専門分野を受講します。

最後に、私はトピックを完全に学ぶことができると感じていると言いたいです。実際、時間の経過とともに、オンラインで利用できる大学院レベルのコース(たとえば、スタンフォードCS231N、CS234など)を受講するつもりです。私の意見では、オンラインコースは十分に厳格ではない可能性があるためです。うまくいけば、防衛の後、私はこれにフルタイムで集中することができるでしょう。

したがって、質問:

  • この時点でまだ雇用できますか(つまり、上記の知識でこの学期を終えた後)?正直、まだ準備は出来ていないと思いますが、1年で上手くいけると自信を持っています。

  • 会社が私にチャンスを与えると考えるのがあまりにも単純すぎるのですか?

  • どうしてもヒラブルになるにはどうすればいいですか?


1
私がドイツでの仕事に応募したとき、数学の知識だけを考慮した会社が少なくとも2社ありました。彼らは他に何も気にしませんでした。プログラミングは有利ですが、彼らには専任のプログラマーがいて、主に数学者や物理学者が取り組んでいるものをソフトウェアに変換します。
ベン

回答:


4

私は他の答えには反対しませんが、ここにあなたが心に留めておくべき別の見方があります。また、データサイエンスのアカデミア(数学/ CSを応用)を去った人として、特定の質問に対する回答を提供できます。

要するに、ビジネス問題の根本的なニーズとユースケースを理解することは、どのプロジェクトにとっても最も重要なことです。そのため、データサイエンスのキャリアを最大限に伸ばしたい場合は、強いビジネスセンスと職域を超えたコミュニケーションスキルを養うことが重要です。

  • この時点でまだ雇用できますか(つまり、上記の知識でこの学期を終えた後)?正直、まだ準備は出来ていないと思いますが、1年で上手くいけると自信を持っています。
  • 会社が私にチャンスを与えると考えるのがあまりにも単純すぎるのですか?

一緒に答えます。それは会社とその現在のニーズに強く依存します。あなたにとって、これは「スタートアップ」から「エンタープライズ」、「MLショップ」から「一般的なデータ駆動型ビジネス」という次元に沿って変化する可能性があります。後者とは、ML製品またはサービスをクライアントに販売することを唯一の目的とする企業と、ビジネスでモデリングを活用したいと考えている一般的なテクノロジー企業が存在することを意味します。新しいプロジェクトの開始を戦略化する準備が整っていない可能性が高いため、すでにMLユースケースが構築されているか、他のユーザーから指示されている企業に、より速く/より簡単に適合できる可能性があります。

したがって、それは、MLモデルの技術を研ぎ澄ますことに専念する部署があり、会社の他の部分がビジネス戦略と設計を決定している、または製品としてMLに焦点を当てているあらゆる規模のビジネスの場合に当てはまる可能性があります。サービス。

短期的には、はい、あなたはおそらく、いくつかのプロジェクトでのインターンやアシスタントとしてあなたを持っている人を説得することができますが、あなたの博士号はおそらく可能性として見られる欠点あなたはジェネラリストを雇うしたいメディア企業に小さなに話をしている場合/すべての取引のジャック...

  • どうしてもヒラブルになるにはどうすればいいですか?

これは私にこれをもたらします。さまざまな種類の役割があるので、自分の冒険を選ぶことができますが、各潜在的な雇用者がどのような役割と状況を求めているかを認識し、それにどのように適合するかを現実的に考えてください。多くの雇用者は、自分が何を望んでいるか、何が必要かを明確に表現していないか、それが何であるか自分自身さえ知らない人がたくさんいます。大きな失望を避けるために彼らと一緒にそれを理解するのはうまくいくでしょう。

データサイエンスの視野を広げ、ビジネスへのインパクトと専門能力開発の機会を最大限に確保したい場合は、データサイエンスのビジネスアプリケーションについてもっと学びたいと思います。これらは非常に多様性があり、実際には非公式であり、疑似反転行列の最適化を心配するよりもビジネス全体に大きな影響を与えます。

市場に関する他の投稿された回答の合理的な意見にもかかわらず、次のようなデータサイエンティストの私の意見には、大きな市場赤字があります。

  • ビジネスニーズを真に理解し、非技術者と効果的にコミュニケーションできる
  • 一般的なデータ駆動型の問題解決を含む計画を作成して実行します。これには、「クールな」モデルの構築が含まれる場合と含まれない場合があります(率直に言って、少なくとも従来の探索的方法で問題が十分に理解されるまでは、そうではありません)。

とても良い答え
pcko1

私(新卒修士課程)は、OPとは反対の立場にあると信じています。ここでは少しプログラミング、ここでは少し数学ですが、どこにもあまり深くありません。私の教育は一般的すぎるので、目立ちにくいです。最後から2番目の弾丸で述べたように、私には十分なソフトスキルがあります。技術的な概念を完全に理解すると、素人にそれを説明するのはかなり上手になります。私は海軍の将校でもあったので、私は人と協力して「イメージ」を投影する多くの経験を持っています。それはビジネスの考え方にクロスオーバーすると思います。
rocksNwaves

10

データサイエンスの仕事はさまざまな活動を対象としているため、回答は主観的なものになる可能性があります。私は学界にいるので、就職市場に関する私の知識は限られていますが、私が見ることができるものから:

  • 現在のコンテキストは、仕事を探しているデータサイエンティストにとって非常に有利です。そのため、MLの基本的な知識を持つ人なら誰でもチャンスを得ることができます。あなたはすでにこのレベルを超えているので、この前の私見は心配ありません。この傾向はこのように続く可能性がかなり高いですが、誰も未来を知りません。
  • 理想的には、可能性を高めるために、たとえばgithubプロジェクト、MLコンテストへの参加など、実際の経験があることを実証できるはずです。
  • 数学のPhDをおろそかにしないでください。データサイエンスを学ぶのに十分な時間があるようですが、PhDが最優先事項であることを確認してください。データサイエンスとは関係ありません。

答えてくれてありがとう!
John D

3

アーワンはそれを釘付けにした(+1)。しかし、私の追加はコメントには少し長すぎると思います。

あなたは私が私のDSの仕事を上陸させたときの私よりもずっと先にいるようです。私は純粋な数学に従事していて、数人のポスドクであり、業界のデータサイエンスに申し込んでいる間、ほんの少しの独学しかありませんでした。

一方、私は学部で保険数理試験を受けていたため、おそらくフィンテックの分野に入るのに役立ちました。適用するときは、すでに知っていることを強調し、最初の数か月で何を学ぶ必要があるかを認めます(より強力なプログラミング?gitを使用して?...)。

(また、MLコースでツリーベースのモデルについて言及していませんでした。それは単なる脱落だったと思いますが、ニューラルネットを使用する業界に進出しない限り、これらは理解する最も重要なモデルのようです規範です)


答えてくれてありがとう!純粋な数学者がデータサイエンスに行くのはこれが初めてではありません。
John D

Courseraのディープラーニング専門分野など、オンラインコースについてどう思いますか。このタイプのコースは本当にあなたが業界で働く準備ができていますか?
John D

Coreseraに行くよりも速く試してください。aiコースは実際のアプリケーションに合わせて調整されています。コースラは、トピックや主題、コンセプトを教えてくれるMOOCがあれば、どのコースでも見ることができます。これらの学習したツールを必要なアプリケーションに使用します。ちょうどそれが入るだけだと考えすぎないでください。あなたがあなたの情熱を見つけることを保証します。
khwaja wisal

3

このアドバイスを盲目的に受け取らないでください。あなたが数学で述べた主題は、機械学習/ディープラーニングを使用して問題を解決するための中核です。プログラミングは、学習したすべての理論を実装するためのツールであり、それに基づいて仮説を作成し、次にコーダーのコーディングスキルを必要としないため、コードで実装してテストします。特に、データフレームとテンソル操作、および実装中に学習する残りの部分のデータ構造を知っておく必要があります。あなたとの最良の部分はあなたが数学の基礎知識を持っていることです(私はあなたが確率統計多変量計算、機能分析とあなたが言及した残りの主題を知っていると仮定しています)あなたはすでに博士号を取得しているので詳細には触れません。

ジェレミーハワード(文字通りディープラーニングの神)が教えるFast.aiのすべてのコースを受講することをお勧めします。コーダーの実践的なディープラーニングに関する彼のコースには、ニューラルネットワークの背後にある数学のコアとなる知識以外の知識が満載ですマイケルニールセンのneuralnetworksanddeeplearning.comというブログは実際には本であり、素晴らしいものです。数学的な説明が好きで、理解を深めるためにいつでもクリスオラのブログにアクセスして読むことができます。

ですから今では、多くの研究インターンシップを取得し、産業環境でそこで学び、学ぶことができますが、私はむしろあなたにこれらのコースに時間をかけて問題を理解し、あなたの背後にある数学を学んでください。何でもする準備ができています。ほら、今のデータサイエンスは誰もが1になりたい6桁の給与を受け取りたいというようなものですが、データサイエンスは一度にすべてを学ぶことができるものではなく、時間がかかるものではありません。

しばらくお待ちください。今すぐ無料で利用できるようになった最新のトピックに関する文学論文を読み続けてください。そのまま続けてください。


答えてくれてありがとう!しましょう。
John D
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.