特定のトピックに関する知識のないデータサイエンスは、キャリアとして追求する価値がありますか?[閉まっている]


15

最近誰かと会話をし、データ分析に興味があり、必要なスキルとツールを習得するつもりだと話しました。彼らは私に、ツールを学びスキルを構築するのは素晴らしいことですが、特定の分野の専門知識がない限り、そうすることにはほとんど意味がないと示唆しました。

彼らは基本的に、いくつかの木製の箱を建てることができ、より良いもの(キャビン、食器棚など)を建てることができるツールの山を持つビルダーのようになりますが、特定の分野の知識がなければ決して特定の製品のために人々が訪れるビルダーになります。

誰もこれを見つけましたか、これをどうするかについての入力がありますか?物事のデータサイエンスの側面を学び、専門化するためだけに新しい分野を学ばなければならないのが本当だと思われます。


あなたの質問は有効ですが、これは適切な場所ではありません。キャリア関連の質問は、ここではトピック外と見なされます。
シェルドンクレガー14年

あなたが何を求めているのか明確ではありません-ツールを学ぶか、ドメインの知識を集めるほうが良いですか StackExchangeにとっては、おそらくあまりにもオープンエンドで意見ベースです。
ショーンオーウェン14年

回答:


42

Drew ConwayがData Science Venn Diagramを公開しました。

データサイエンスベン図

一方で、あなたは彼の投稿を本当に読むべきです。一方、私は自分の経験を提供することができます:私の主題の専門知識(数学/統計とハッキングで実際に「実質的な専門知識」も持っている必要があるので、「実質的な専門知識」よりも用語として好きです)小売業では、私の数学/統計は予測および推測統計であり、私のハッキングスキルはRにあります。

この有利な点から、小売業者と話をして理解することができます。少なくともこの分野に関する十分な知識を持たない人は、小売業者とのプロジェクトで急な学習曲線に直面する必要があります。サイドギグとして、私は心理学の統計を行います、そしてそれは全く同じです。そして、図のハッキング/数学/統計の部分についてかなりの知識があったとしても、たとえば、クレジットスコアリングや他の新しい主題分野に追いつくのに苦労します。

あなたが数学/統計情報やハッキングスキルの一定量を持っていたら、それは非常に加えることでより一人の以上の被験者に接地を取得するために、より良いまだ、あなたのハッキングのスキルに別のプログラミング言語を、あるいはまだ別の機械学習アルゴリズムを数学/統計ポートフォリオに追加します。結局のところ、数学/統計/ハッキングの基礎をしっかり身に付けたら、そのような新しいツールをウェブや教科書から比較的短期間で学ぶことができます。しかし、一方で、主題の専門知識は、ゼロから始めるとゼロから学ぶことはできないでしょう。クライアントは、数学/統計/ハッキングの方が優れていても、基本を学ぶ必要がある最初のデータサイエンティストBよりも、特定の分野を理解しているデータサイエンティストAと協力します。

もちろん、これはすべて、3つの分野のいずれの専門家にならないことを意味します。しかし、あなたはデータサイエンティストであり、プログラマ、統計学者、または主題の専門家ではないため、それは問題ありません。3つの別々のサークルには、常に学習できる人がいます。これは、データサイエンスについて私が気に入っていることの一部です。


編集:しばらくしてから少し考えてから、この投稿を図の新しいバージョンで更新したいと思います。ハッキングスキル、数学と統計の知識、実質的な専門知識(読みやすさのために「プログラミング」、「統計」、「ビジネス」に短縮)はまだ重要だと思いますが、コミュニケーションの役割も重要だと思います。ハッキング、統計、ビジネスの専門知識を活用して得られるすべての洞察は、そのユニークな知識のブレンドを持っていない人にそれらを伝えることができなければ、少しも違いはありません。お金を使ったり、プロセスを変更したりする必要があるビジネスマネージャーに、統計的な洞察を説明する必要があるかもしれません。または、統計的に考えていないプログラマーに。

新しいデータサイエンスベン図がここにあります。これには、コミュニケーションも不可欠な要素の1つです。覚えやすいように、最大​​の炎を保証する方法でエリアにラベルを付けました。

コメントしてください。

新しいデータサイエンスベン図

Rコード:

draw.ellipse <- function(center,angle,semimajor,semiminor,radius,h,s,v,...) {
    shape <- rbind(c(cos(angle),-sin(angle)),c(sin(angle),cos(angle))) %*% diag(c(semimajor,semiminor))
    tt <- seq(0,2*pi,length.out=1000)
    foo <- matrix(center,nrow=2,ncol=length(tt),byrow=FALSE) + shape%*%(radius*rbind(cos(tt),sin(tt)))
    polygon(foo[1,],foo[2,],col=hsv(h,s,v,alpha=0.5),border="black",...)
}
name <- function(x,y,label,cex=1.2,...) text(x,y,label,cex=cex,...)

png("Venn.png",width=600,height=600)
    opar <- par(mai=c(0,0,0,0),lwd=3,font=2)
        plot(c(0,100),c(0,90),type="n",bty="n",xaxt="n",yaxt="n",xlab="",ylab="")
        draw.ellipse(center=c(30,30),angle=0.75*pi,semimajor=2,semiminor=1,radius=20,h=60/360,s=.068,v=.976)
        draw.ellipse(center=c(70,30),angle=0.25*pi,semimajor=2,semiminor=1,radius=20,h=83/360,s=.482,v=.894)
        draw.ellipse(center=c(48,40),angle=0.7*pi,semimajor=2,semiminor=1,radius=20,h=174/360,s=.397,v=.8)
        draw.ellipse(center=c(52,40),angle=0.3*pi,semimajor=2,semiminor=1,radius=20,h=200/360,s=.774,v=.745)

        name(50,90,"The Data Scientist Venn Diagram",pos=1,cex=2)
        name(8,62,"Communi-\ncation",cex=1.5,pos=3)
        name(30,78,"Statistics",cex=1.5)
        name(70,78,"Programming",cex=1.5)
        name(92,62,"Business",cex=1.5,pos=3)

        name(10,45,"Hot\nAir")
        name(90,45,"The\nAccountant")
        name(33,65,"The\nData\nNerd")
        name(67,65,"The\nHacker")
        name(27,50,"The\nStats\nProf")
        name(73,50,"The\nIT\nGuy")
        name(50,55,"R\nCore\nTeam")
        name(38,38,"The\nGood\nConsultant")
        name(62,38,"Drew\nConway's\nData\nScientist")
        name(50,24,"The\nperfect\nData\nScientist!")
        name(31,18,"Comp\nSci\nProf")
        name(69,18,"The\nNumber\nCruncher")
        name(42,11,"Head\nof IT")
        name(58,11,"Ana-\nlyst")
        name(50,5,"The\nSalesperson")
    par(opar)
dev.off()

1
更新された図を参照するブログ投稿でここに来ました。これは元のConwayバージョンの大きな改善だと思いますが、重複の大きさからわかるように、Statistics Profは統計とコミュニケーションのスキルが同等であるという概念を十分に乗り越えることはできません。
ロバートデグラフ

0

もちろんできます。企業はデータサイエンティストを求めています。ただし、用語の解釈がすべて異なることに注意してください。会社によっては、統計から生産コードの作成まで何でもするように求められる場合があります。どちらか一方はそれ自体がフルタイムの仕事であり、両方に備えなければならないので、その上で深い専門知識を求めることは合理的ではなく、私の意見では、私が話し合った企業は他の2つの分野を強調しました(特にプログラミング)。しかし、私はあなたが直面するかもしれない問題の種類に精通していることが役立つことがわかりました。セクターに応じて、異常検出、推奨/パーソナライゼーション、予測、レコードのリンクなどがあります。これらは、数学やプログラミングと同時に例として学ぶことができます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.