データサイエンスを自己学習する方法 [閉まっている]


16

私は独学のWeb開発者であり、自分でデータサイエンスを教えることに興味がありますが、どのように始めるべきかはわかりません。特に、私は疑問に思っています:

  1. データサイエンスにはどのような分野がありますか?(例:人工知能、機械学習、データ分析など)
  2. 推奨できるオンラインクラスはありますか?
  3. 私が実践できるプロジェクトがありますか(オープンデータセットなど)。
  4. 申請または完了できる認定資格はありますか?

回答:


15

マーティンのサイトへようこそ!これは非常に広範な質問なので、おそらくさまざまな答えが得られるでしょう。これが私の見解です。

  1. データサイエンスは、一般的に古典的な統計、機械学習、コンピューターサイエンスを組み合わせると考えられている学際的な分野です(ここでも、これはあなたが尋ねる人によって異なりますが、他にはここでビジネスインテリジェンス、情報の可視化や知識発見も含まれます;たとえば、データサイエンスに関するウィキペディアの記事)。優れたデータサイエンティストは、彼らが働いているドメインのドメイン固有の特性を理解することにも熟練しています。たとえば、病院の記録の分析に取り組んでいるデータサイエンティストは、バイオメディカルインフォマティクスのバックグラウンドを持っている方がはるかに効果的です。
  2. 興味のある分析の種類に応じて、ここには多くのオプションがあります。AndrewNgのコースラコースは、ほとんどの人が最初に言及したリソースであり、当然です。機械学習に興味があるなら、それは素晴らしい出発点です。関係する数学の詳細な調査が必要な場合は、TibshiraniのThe Elements of Statistics Learningは優れていますが、かなり高度なテキストです。Ngに加えて、コースラには多くのオンラインコースがありますが、焦点を当てたい分析の種類や作業を計画しているドメインを念頭に置いて選択する必要があります。
  3. Kaggle。実際の分析の問題に飛び込みたい場合は、kaggleから始めてください。ただし、専門知識のレベルに応じて、よりシンプルなものから始めることをお勧めします。Project Eulerは、私がまだ準備作業として使用している1回限りの練習問題の優れたリソースです。
  4. 繰り返しますが、これはおそらくあなたが働きたいドメインに依存します。しかし、データサイエンス関連の一連のコースを修了すると、Courserはデータサイエンス証明書を提供します。これはおそらく開始するのに適した場所です。

幸運を!他に具体的な質問がある場合は、コメントでお気軽にお問い合わせください。できる限りのお手伝いをいたします。


1
これに戻ると、Andrew Ngのコース難しいです。私は数学が苦手だと言っておくべきだった。この他のデータサイエンスコースは、ロープを学ぶのに少し簡単だと聞きました。どう思いますか?
マーティン

5

私は独学のデータサイエンティストであり、その方法を説明するために最善を尽くします。


データサイエンスにはどのような分野がありますか?(例:人工知能、機械学習、データ分析など)

データサイエンスは非常に広い領域です。データの科学についてです。したがって、データを使用して意思決定を行うフィールドはすべてこのドメインに属します。いくつかのフィールドが含まれます:

  • AI
  • パターン認識と分析
  • 生物統計学
  • 統計学習
  • 機械学習
  • データの美学(またはデータの視覚化)
  • データジャーナリズム

推奨できるオンラインクラスはありますか?

同様の質問に答えました。だから私はここに引用します:

Courseraの機械学習コースから始めます。生徒に機械学習の領域を紹介するのに非常に役立ち、概念の強固な基盤を築くのに役立ちます。

場合によっては、数学はそのコースで少し馬鹿げていると感じます。同じ教授が教えるこのコースを受講でき、前者よりも数学が集中します。

これで、機械学習の基本概念について明確な直感が得られます。さて、このコースを受講してください。これは、Andrew Ngのコースのフォローアップまたは補足と言えます。

IAPRのこのリソースには、相互検証、正則化などのMLの概念に関する詳細なメモがあります。

Quoraのブログにまとめられたこれらのすばらしいリソースのリストもご覧ください。

今、ニューラルネットワークとディープラーニングの高度な概念に飛び込むために、この無料の本を利用できます。

最後に、無料の電子書籍:統計学習の要素は、MLまたは統計学習の初心者向けの素晴らしい本です。

それに加えて、Quoraによるこのデータサイエンスリファレンスのリポジトリをご覧ください


私が実践できるプロジェクトがありますか(オープンデータセットなど)。

私はインドのオープンなデータセットでプロジェクトを始めました。ただし、ここでこの素晴らしい議論を確認することをお勧めします。これらのプロジェクトを行った後、Kaggleから始めることができます。


申請または完了できる認定資格はありますか?

私の意見では、データサイエンスの認定はありません。ええ、ビッグデータの認定はたくさんありますが、私はそれらが新進のデータ科学者にとって本当に役立つとは思わなかったので、MLとデータのスキルに十分自信があるまで、それらを追いかけないことをお勧めします。


1

データサイエンスのCoursera専門分野から始めることをお勧めします。Johns Hopkinsによるデータサイエンス専門分野は、最も古いランニング専門分野です。本やカグルはお勧めしません。彼らは最初はあなたを混乱させるだけです。コーディングはデータサイエンスの最も簡単な部分であり、多くのことを学ぶ必要があることに留意してください。この分野についてのアイデアを得るには、このベン図が良い出発点です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.