博士号なしでデータマイニングの仕事をする


73

私はしばらくの間、データマイニング機械学習に非常に興味がありました。その理由の1つは、学校でその分野を専攻していましたが、プログラミングだけでなく、知識とそのソリューションが複数の形式を持つことができます。私には研究者/科学者のバックグラウンドはありません。データ分析に重点を置いたコンピューターサイエンスのバックグラウンドから来ました。博士号ではなく修士号を取得しています。私は現在、データ分析に関連する立場を持っています。たとえそれが私がしていることの主な焦点ではないとしても、少なくともある程度はそれをよく知っています。

数年前にいくつかの企業と仕事をするためにインタビューし、数人のリクルーターと話をするようになったとき機械学習を行うには博士号が必要だと人々が考える一般的なパターンを見つけました。少し一般化しすぎています(一部の企業は、特に博士号を本当に探していませんでした)。

その分野で博士号を取得するのは良いことだと思いますが、これが絶対に必要だとは思いません。私はほとんどの現実世界の機械学習アルゴリズムについてかなり適切な知識を持ち、それらのほとんどを自分で(学校でも個人プロジェクトでも)実装しており、機械学習/データマイニングおよび統計一般に関する問題に取り組む際にかなり自信を持っています。また、似たようなプロフィールを持っている友人もいますが、これについても非常に精通しているようですが、博士号を取得していない場合、一般的に企業はデータマイニングの採用についてかなり恥ずかしがっていると感じています。

フィードバックをもらいたいのですが、その分野に非常に焦点を当てた仕事をするためには、博士号が絶対に必要だと思いますか?

(ここでこの質問を投稿する前に少し迷いましたが、メタに関する許容可能なトピックであると思われるため、私はしばらくの間考えていたこの質問を投稿することにしました。)


1
このサイトには、最近よく似た質問がいくつかあります。あなたもそれらを見るかもしれません。あなたの質問は明確に述べられていますが、ローカライズされないようにするために、あなたの特定の状況に少し焦点を合わせるのが少し良いかもしれません。
枢機

1
また、学校でデータマイニングと機械学習を専攻したとはどういう意味ですか?たとえば、そのような学位存在する可能性のある北米の大学は1つか2つしか考えられません。私あなたがこれをある程度の焦点として持つことができる多くのMSプログラム想像することができますが、それでもおそらくそう呼ばれていません。
枢機

フィードバック@cardinalのおかげで(これが私の最初の投稿です)、私が見つけた唯一の質問は少し異なっているように見えました。 。
チャールズメンガイ

1
CSで修士号を取得していますが、専攻はデータマイニングです。私はもともとアメリカ出身ではありません:)
チャールズメンガイ

3
答えを出さずに2セントを投じると思いました。私はデータマイニングと機械学習を行っており、ほとんどの分野で自習しています(CS関連のトピックの学士号を除く)。アカデミックMLのトピックはビジネスアプリケーションとは非常に異なりますが、それぞれに足を踏み入れるのは良いことです。
ダン

回答:


56

実際、あなたの結論の反対は真実だと思います。で使い捨て学術、いくつかのポインタが修士の学位保持者の上に博士号保有者のための応用数学、数学、およびコンピュータサイエンスの低賃金プレミアムについて与えられています。部分的には、修士号取得者は通常、同じくらいの理論的深さ、優れたプログラミングスキルを持ち、柔軟性が高く、会社の特定のタスクについてトレーニングできることを企業が認識しているためです。たとえば、SVMの弟子を取得して、意思決定ツリーに依存している会社のインフラストラクチャを評価するのは簡単ではありません。多くの場合、誰かが特定の機械学習パラダイムに膨大な時間を費やしていると、生産性を他のドメインに一般化するのに苦労します。

別の問題は、最近の多くの機械学習の仕事はすべて物事を成し遂げることであり、論文を書くことや新しい方法を開発することではないことです。新しい数学ツールの開発、メソッドのVC次元の側面、その基礎となる複雑性理論などを研究するために、リスクの高いアプローチをとることができます。

一方、ポーズレットのようなものを見てください。基本的に、poseletから新しい数学はまったく発生しません。それは完全に非合法で、不格好であり、数学的な洗練を欠いています。しかし、大きなデータセットに驚くほどうまくスケールアップし、今後しばらくの間、ポーズ認識(特にコンピュータービジョン)の定番となるようです。これらの研究者は素晴らしい仕事をし、彼らの仕事は称賛されるべきですが、それはほとんどの人が機械学習の博士号に関連するものではありません。

このような質問をすると、さまざまな意見がたくさん出てくるので、ぜひともそれらすべてを検討してください。現在、私はコンピュータービジョンの博士課程の学生ですが、修士号を取得してプログラムを早めに辞めることにし、自然言語の機械学習、計算統計などを行う資産管理会社で働いています。いくつかの大手テレビ会社での広告ベースのデータマイニングジョブ、およびいくつかのロボットジョブ。これらのすべての分野で、数学的成熟度を持ち、複数のプログラミング言語で問題を解決するコツを持っている人には多くの仕事があります。修士号を取得するだけで十分です。そして、そのエコノミストの記事によると、基本的に博士号を持つ人と同じように報酬が支払われます。学外で働いているなら、

ピーター・ティエルがかつて言ったように、「大学院の学校は、人生の目覚まし時計のスヌーズボタンを押すようなものです...」


6
そのエコノミストの記事が出版されたときに最初に読んだとき、それは最初から研究が不十分で苦い暴言のように聞こえました。終わりに近づいて、著者が博士号の不幸な受け手であると知ったとき、私は驚きませんでした。それ以来、何度も読み直してきたので、私の意見はあまり変わっていません。通常、エコノミストは、学問的な問題であっても、より優れています。
枢機

9
素晴らしい記事だと思います。最近の大学院でのインセンティブ問題の多くを強調しています。別の興味深い記事は、The Rise of the Post-Doc as Principal Investigatorです。記事の研究が不十分だと思う理由がわかりませんが、より具体的な批判を提供できますか?確認バイアスを避けることが重要であることに同意します。しかし、読者としては、ソースが良好である限り、ライターが確認モードであるかどうかはあまり気にしません。私が懸念している限り、学問についてのより激しい暴言があるはずです。
12

8
エコノミストの記事に対するいくつかの主要な批判があります。客観的と思われる分析的な部分を読むとき、それから滲み出る感情は私が最初に気付くべきではないという事実を超えています。残念なことに、これらは600文字に収まりませんが、大丈夫なブログ投稿になるかもしれません。作品の前提は最初から間違っていると思います。経済的利益のために博士号を取得しようとする人は、すでに意図した目的を誤解しています。それでも、賃金プレミアム分析には致命的な欠陥があり、博士号保有者の大部分がまだ去っていくという事実を説明していないということです...-
枢機

3
...学界へ。そして、この効果だけで、特に数学のような分野では、賃金とプレミアムの分析が低下します。
枢機

4
また、少なくとも応用科学では、大部分がまだ学界に入るというあなたの主張に絶対に異議を唱えます。事実上、私の同僚はポスドクを過ぎて学界に留まったことがありません。彼らはマイクロソフト、グーグル、nVidia、Facebook、金融会社などで働いています。大学院開発シンポジウムが注目する最大のことの1つは、学業の在職期間と非現実的な見込みを獲得する能力の低下です。
12

47

免責事項:私は博士号を持っています。機械学習で働きます。とはいえ、アカデミックになる以外に博士号は必要ないと思います。あらゆる分野で働く。博士号取得 特定の研究スキルの向上に役立ちますが、

  1. ほとんどの仕事にこれらの研究スキルは必要ありません。
  2. 博士号を取得せずにこれらのスキルを習得できます。程度。

Financial Timesの主席経済特派員であるMartin Wolfには博士号がありません。(彼は修士号を持っています)が、彼の言葉はほとんどの博士号よりもずっと重要です。卒業生。あらゆる分野(機械学習を含む)で成功するには、自分で完全なものを学び、考える方法を知る必要があります。博士号 これらのスキルを練習するのに役立ちますが、それ自体で終わりではありません。あなたが博士号を持っていないという理由だけであなたにインタビューしたくない人は、おそらくとにかく働く価値はありません。


博士号を持っている人からアドバイスを受けることは非常に興味深いです。博士号は確かに厳格であり、ほとんどの研究指向のポジションにとって「プラス」になり得ることに同意します。これは、大企業が機械学習の修士号を採用することに対してよりオープンであるように思われます(繰り返しますが、それはどの企業に依存します...)。現在、私は良い妥協案を見つけました。まず、現在のポジションで現実世界の経験を積むことによって、キャリアをその道にさらに向けることを期待しています。すばらしいアドバイスをありがとう。
チャールズメンガイ

2
@linkerはスタートアップの事に同意できません。私はCSに修士号を持っています(ただし、MLの修士論文)、私の最初のポジションはスタートアップでした。スタートアップは、仕事を成し遂げることができる(そして会社の他の人とうまく遊ぶことができる)幅広い思想家を定期的に探しているので、タイトルを気にするべきではありません。単一のHRドローン(苦味はなく、ユーモアがここにあります;))
steffen

1
PhDがPhDを推奨しない場合、またはIvyの卒業生がIvyに進学しないことを推奨する場合に気に入っています。ピーター・ティールが大学に行かないように提案しているようです。男はスタンフォードからJDを得た:)
Aksakal

1
それは本当にあなたが博士号で何をしようとするかにかかっています。あなたの目標が学界である場合、それは必須です、しかし、あなたの目標が研究をすることでない限り、産業では、それは本当に大きなプラスではありません。成功しているハイテク企業とその経営陣(ある場合はCTOやEngのSVPを含む)を見てください。そこにいくつのSTEM Phdsがありますか?彼らは存在しますが、まれであり、多くの場合彼らは創立者の一人です。博士号を持つことはいくつかの扉を開くかもしれませんが、実際に何かを成し遂げるためには、現実世界の経験と基礎(数学を含む)の深い知識がより重要です
user765195

19

免責事項:私はCSで博士号を取得しておらず、機械学習の仕事もしていません。私は他の知識と経験から一般化しています。

ここにはいくつかの良い答えがあると思いますが、私の正直な意見では、それらはまだ主要な問題を明らかにしていません。私はそうしようとしますが、根本的に異なることを言っているとは思わないことを認識しています。ここでの主な問題は、スキル開発とシグナリングに関するもの です。

スキル開発に関しては、最終的には(従業員として)仕事を成し遂げ、上手く、そして早く成し遂げることを望み、雇用主はそのような人を望んでいます(またはそうすべきでしょう)。したがって、ここでの質問は、追加の2年間のアカデミックトレーニングでどれだけのスキル開発が得られるかということです。確かにあなたは何かを得ているはずですが、大学院に進学しない人はおそらく卒業するまでダフの上に座っているだけではないことを認識しています。したがって、あるセットの経験(アカデミック)と別のセット(仕事)を比較しています。良い点は博士号の質と性質に依存します。プログラム、あなたの本質的な興味、あなたがどのように自己志向であるか、そしてどんな種類の機会とサポートがあなたの最初の仕事で利用できるでしょうか。

継続的なアカデミックトレーニングがスキル開発に与える効果以外に、信号の効果と価値(つまり、名前の後に「Ph.D」が付加される)の問題があります。シグナルは2つの方法で役立ちます。1つ目は、最初の仕事に就くのを助けることができることです。それは却下すべきではありません。非常に重要です。調査によれば、自分にふさわしくない最初のポジションで仕事を始める義務がある人は、良い仕事に就く人と同じように(平均してキャリア的に)する傾向はありません。彼らの能力と興味にマッチします。一方、コンセンサスはあなたの最初の仕事の、あなたの将来の見通しはあなたの学歴よりもあなたの前の仕事でのパフォーマンスによってはるかに強く影響されるようです。

シグナルの2番目の側面は、アナリストと分析の消費者との関係に関係しています。@EMSは、コメントでこの点を明らかにするのに適しています。。多くの小さなコンサルティングショップがあり、彼らは潜在的なクライアントに見せるために博士号を持っているのが大好きです。最初の会議で、契約書、レターヘッド、完成品のプレゼンテーションなどで。博士号は常にそこにあります。これについて皮肉を言うのは簡単ですが、コンサルティング会社と消費者には正当な価値があると思います。舞台裏では、一部の仕事は資格の低い有能な人々に耕作されているかもしれませんが、彼らは博士号を望んでいます。フロントエンドの場合、および成果物が配信される前にその成果物を承認する場合。彼らが資本を引き付けようとしていて、投資家を安心させたいと思っているなら、私はスタートアップで似たようなことが起こるのを見ることができました。


5
(+1)この答えは問題の核心に近づき始めていると思います。実際にはOPから2つの質問があり、1つとして提示されます(少なくとも、私が見ているように)。最初は(1)博士号のない人でも、データマイニングや機械学習で業界で有意義な仕事をすることができますか?答えは間違いなく肯定的です。2つ目は、(2)この分野での経験が少なく、博士号なしでそのようなポジションを獲得できますか(そして、これを達成するのはどれほど難しいですか)。後者の方がおそらく定量的に測定するのが簡単かもしれませんが、灰色の領域が多いようです。
枢機

3
また、ロビンハンソンは最近、少なくともwrtコンサルティングで、このシグナリングとクレデンシャルの側面に関するいくつかの良い内容を書きました。
12

14

ここで言われたことのほとんどに同意しますが、金融の仕事に応募するときに生じるいくつかの実際的な問題を紹介したいと思います。特定の取引または量的開発者のポジションに応募するには、統計学または数学の博士号が必要であることを示す広告が表示されることがよくあります。これにはいくつかの特定の理由があることを知っています。気をつけて、私はこれが正しいと言っているわけではありませんが、それは実際に起こることです:

  • 特に最も有名な企業には、この仕事に多くの応募者がおり、雇用主は各候補者に十分な時間を捧げることができません。学歴に基づいてアプリケーションをフィルタリングすると、人口サイズが管理しやすい数に縮小されます。はい、ミスがあります。はい、それは生産的な個人を見つけるための最良の方法ではありません。しかし、平均して、あなたは技術を学ぶために何年も捧げた熟練した専門家を見ています。少なくとも、複雑な研究​​プロジェクトを追い抜く規律が必要です。

  • チームと会社は、投資家やクライアントに紹介するために、多くの博士号を取得して充実させます。これは、会社に「オラクル」知識のイメージを与え、その評判に利益をもたらします。会社の無形評価は上昇する可能性があります。平均的な投資家は、このような知識豊富な科学者チームに資金を提供することに自信を持ちます。MBAについても同様の指摘ができます。

  • 最後に、企業ポリシーにより、より高い学業成績には優先的なキャリアパスと報酬が必要であると規定される場合があります。これは、金融だけでなく、さまざまな業界のほとんどの企業に当てはまると思います。数学の博士号を管理するコンピューターサイエンスの理学士号を持つジョンを見るのは難しいです。


14

免責事項:私はリクルーターであり、1982年以来、あなたの質問をよく理解しています。このように分解してみましょう。あなたの履歴書は選別装置です。企業はたくさんの履歴書を受け取っているので、「なぜこの人と話をしたくないのか?」という質問を念頭に置いて履歴書を読んでいます。これにより、ニーズを満たせる可能性が最も高い少数の候補者の数が減ります。面接を受けて履歴書に博士号が表示されない場合、ここで何か他のことが行われています。私は、履歴書がスクリーニングOUTデバイスであるように、インタビューはスクリーニングINデバイスであると言います。彼らがあなたをインタビューに招待したら、彼らはすでにあなたが仕事をするのに十分な「紙の上」であると結論付けています。ですから、あなたがインタビューを歩いているとき、唯一の質問は 本当に尋ねるのは「なぜあなたを雇うべきなの?」です 彼らが雇う人は、会社のニーズに最もよく応えることができる個人です。

リクルーターとしての私のアドバイスは、インタビューを通して質問をして、彼らのより深いニーズを特定することです。私を信じて、ジョブの説明がめったに真実に似ていないので、あなたは彼らのホットボタンを調べて、それらの問題に直接販売したいと思うでしょう。インタビューが尋問のように感じないようにし、質問が終わるのを待ってはいけません。あなたは炎の中で落ち、「あなたは博士号を持っていません」と言われることになります。敬意を払いつつ、彼らが問題を解決するのを支援する意欲を示します。

私のお気に入りの質問は:「何がある特徴あなたはこの役割で知られた最高の人の?」誰もが夢のチームを念頭に置いているので、この役割で成功するために必要な特性を把握することが重要です。これは経験、背景、学位に関する質問ではありません。ほら、私はいつもたくさんの経験を持つ平凡な博士号を見つけることができるので、これは聖杯ではありません。IMOは、必要な人の本質を捉えた職務記述書を他にどのように書くかわからないため、企業が最善だと考え続けているのはまさにそれです。


4
@GailPalubiakサイトへようこそ。個人情報で投稿に署名しないでください。アバターとユーザーページへのリンクがすべての投稿に自動的に追加されることに注意してください。その情報をそこに投稿できます。ここは初めてなので、このようなトピックについて説明しているFAQをお読みください。
GUNG -モニカ元に戻し

14

私の2セント:いいえ、そうは思いません。PhD自体は、データマイニングまたはMLに適した資格を与えるものではありません。kaggle独自のJeremy Howardを入手してください。プログラムの質には大きなばらつきがあるため、博士号は資格についてあまり言及していないとさえ言います。おそらく、博士号が証明する唯一のことは、所有者がフラストレーションに対する高い耐性を持っていることです。

結論:その分野に興味があり、知識があり、創造的で勤勉な場合、なぜ博士号が必要なのですか?あなたのタイトルではなく、あなたが数えるべきです。


2
私は完全に同意しますが、企業/採用担当者は逆に考えているように見えるという強い印象を受けています。以前の仕事でさえ、いくつかの問題でデータマイニングを行うことについて話し合っていたとき、私はエンジニアであり、データサイエンティストではないと言われました。
チャールズメンガイ

3
よく言った。サポートする詳細については、私の回答をご覧ください。この分野の博士号はあまり関係がなく、会社がそうだと思っているなら、おそらくその会社で働きたくないでしょう。ピーターティエルはかつて、「大学院は人生の目覚まし時計のスヌーズボタンを押すようなものです...」
12

6

仕事が博士号を必要とするかどうかは、責任のレベルと雇用主および/または彼のクライアントの認識に依存します。私は博士号を必要とする規律があるとは思わない。確かにデータマイニングを学ぶことができ、従業員は博士号なしで生産的な仕事をすることができます。これは、以前の教育よりも、人、迅速に学習し適応する能力、および文学を理解できる能力に依存します。これは特に、進化している分野であるデータマイニングに当てはまります。そのため、博士号を持つデータマイナーでさえ、時間が経つにつれて学ぶべきことが多くなります。


4
(+1)博士号を必要とする分野の1つは、大学教授です。(もちろん例外はありますが、少数です。)
whuber

2
また、これは統計的に考えられないほどのキャリアであり、ほとんどの大学院生はそれを割り引くか、少なくとも卒業生の間でramp延している教授になるという信念に比べてそれを過小評価すべきです。Research 1大学での教育の状況は(あなたが付属/ポストドックであることに満足していない限り)、過去15年間で米国で大きく変わりました。
12

4

私は応用統計学の修士号を取得しており、ヨーロッパでデータマイナーとして働いていました。私が英国に来たとき、そのような学位のために勉強したことは言うまでもなく、誰もデータマイニングについて聞いたことがありませんでした。今では一般的な場所であり、雇用主は博士号がこの仕事に必要であると感じています。ただし、この仕事に重要なのは統計的知識とモデリングの側面です。私の経験では、ほとんどのIT担当者は統計を理解していないため、仕事をうまく行えません。私は教育を受け、現在、これらの雇用主を満足させるために応用統計学の博士号を取得するために登録しています。1980年代にレベルが非常に高かったときに、ほとんどの博士課程修了者が修士課程で勉強したことをおそらく知っています。優れたデータマイナーであると思います。統計のバックグラウンドが必要です。


4

これは、手元の仕事に完全に依存します。私の経験では(博士号を取得しています)、3種類の仕事があります。まず、言われているように、最近の業界の仕事のほとんどは、適用される機械学習、つまり、問題のドメイン固有の問題に対する既存のMLアルゴリズムの適用調整を対象としています。これらは、最も一般的なMLジョブであり、修士号はこれらの種類のジョブには十分です。企業や大学の研究部門で行われている少数の仕事は、ドメイン固有の問題のために適用、調整、作成されたMLジョブです。新しい数学を使用して既存のメソッドを調べて新しいメソッドを作成する経験は通常時間がかかり、これらの経験は通常博士課程中に得られます。新しい理論上の結果は、他のピア(出版物)の受け入れを得るために十分に堅牢でなければなりません。最後でおそらく最も困難で、最もリスクが高く、最も一般的でない仕事は、研究大学で進行している純粋な理論的なものであり、そこでは新しいアルゴリズムを完全に考案するか、既存のアルゴリズムの数学的特性をよりよく理解する必要があります公開されるのに十分であること)。これも通常、PhDとして得られる経験です。博士課程の学生は、トレーニング中に3つのタイプの仕事すべてにある程度触れたかもしれませんが(プログラムの期間の長さと、実際の仕事のような即時の製品期限がないという事実のため)通常、最初の仕事について十分に訓練されており、おそらく2番目と3番目の種類の仕事に少ししか触れていなかったでしょう。


「仕事」と言うとき、「通常の雇用」または「仕事または仕事」を意味しますか?これらの2つの意味を交互に切り替えているように思われるため、答えが少し混乱します。
アメーバは、Reinstate Monica

2つの間に違いはありますか?純粋に....頼む
stormchaser

2

機械学習のポジションにはPhdが必要だとは思わない。優れたマスターと数学的な好奇心を持つ好奇心が必要です。Phdは、望ましくない専門分野へのアプローチを偏らせます。私はコアの機械学習アルゴリズムに取り組んでおり、それらのほとんどを私が望む方法でコーディングしています。そして、私は多くの博士課程の人々が間違った考え方で見たことがあります。Phdsは主に純粋な理論上の問題によって動機付けられます。これは、迅速な作業ソリューションに焦点が当てられている業界とは異なります。


2

PhDトレーニングを軽視する人々は、PhDが何を意味するのかまったくわからないか、意図的に虚偽のコメントをします。ほとんどの修士課程のトレーニングは、何らかの方法で博士課程のトレーニングと比較することはできません。博士課程トレーニングの強度と厳格さには、想像を絶する献身、自己規律、大きなプレッシャーの下での学習能力、そして堅実なスキルセットが必要です...博士課程のタイトルはすでにそれらすべてを証明していますレベルで....


6
ここの誰もが「博士課程の訓練を見下している」とは思いません。私たちのほとんどは博士号を持っています。私たちの多くは、博士号が必須である学術的な環境で働いています。ここでの回答の一部(たとえば、私自身)は、スキルを持っている資格情報のない人がいる可能性があることと、その人たちも仕事を得ることができることを認識しています。コンサルティング会社のデータサイエンティストとして働いている元BS学生(修士なし)がいます。
GUNG -モニカ元に戻し
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.