機械学習のクックブック/リファレンスカード/チートシート?


57

Probability and Statistics Cookbookデータマイニング用のR Reference Cardなどリソースは非常に便利です。それらは明らかに参考資料として役立ちますが、主題に関する私の考えを整理し、土地を築くのにも役立ちます。

Q:これらのリソースのようなものは、機械学習方法に存在しますか?

各MLメソッドに含まれる参照カードを想像しています:

  • 一般的なプロパティ
  • メソッドがうまく機能するとき
  • メソッドが不十分な場合
  • どのメソッドから、または他のどのメソッドにメソッドが一般化されるか。ほとんど置き換えられましたか?
  • メソッドに関する独創的な論文
  • メソッドに関連する未解決の問題
  • 計算強度

これらすべては、私が確信している教科書を少し掘り下げることで見つけることができます。それらを数ページにすると便利です。


5
いい目標ですが、「教科書を掘り下げることは最小限」ですか?統計学習とデータマイニングに関するこれらの20冊の本 + mloss.org/software/ratingをどうやって圧縮し始めることができますか
デニス


2
(+1)chuzpaの場合、そのような概要が存在する場合、私はそれを支払います。重要な問題は、アルゴリズム自体から派生する可能性があるいくつかのプロパティのほかに、そのようなプロパティまたは経験則の大部分が経験、つまりアプリケーションによって得られることです。戦闘に強い応用研究者またはMLフレームワークプログラマー/コンサルタントがそのようなものを書くことができると確信しています...しかし、今ここに?
ステフェン

@Denis:「20冊の本」リンクは機能しません。これを確認できますか?
lmsasu

6
私は機械学習の専門家ではないので、他の人に答えを投稿するのを延期しますが、統計学習の要素は主題に関する優れたテキストと見なされ、この分野の著名人によって書かれていると思います。この本は高レベルで書かれており、統計で博士号を持っていることをお勧めしていると聞いたことがあると付け加えてください。
マクロ

回答:


25

最高のいくつかの自由に利用可能なリソースは以下のとおりです。

著者の質問については、「すべてを1ページで」解決策に会ったことがありません


セルゲイ、バーバーの本はMatlabに結びついていますか?
デニス

2
はい、本のリンクをご覧ください。BRMLtoolボックスは、数学モデルが実際のMAT-LABコードにどのように変換されるかを読者が確認できるように提供されています。
セルゲイ

31

機械学習を学びたい場合は、Andrew Ng教授が教える冬の無料オンラインMLコースに登録することを強くお勧めします。

私は秋に前の1つをしました、そして、すべての学習教材は並外れた品質で、実用的なアプリケーションに向けられて、本と単独で苦労することをより簡単に理解します。

また、直感的でわかりやすい説明と最小限の計算で、非常に低い成果を上げています。


このコースを終えたばかりで、最高です!また、機械学習に関する本を理解するための素晴らしい出発点となりました。
B七つの

1
このリンクは現在、coursera.org
course /

14

はい、元気です。クリストファー・ビショップの「パターン認識と機械学習」は、一般的な参考資料として優れた本であり、実際に間違いを犯すことはできません。

かなり最近の本ですが、非常によく書かれており、同様に幅広いものがDavid Barberの「Bayesian Reasoning and Machine Learning」です。私が感じると思う本は、この分野の新参者にやや適しています。

私はHastieらの「統計的学習の要素」を使用しました。(Macroによる言及)および非常に強力な本ではありますが、最初の参照としては推奨しません。より専門的なトピックの2つ目のリファレンスとして役立つかもしれません。その点で、David MacKayの本、Information Theory、Inference、およびLearning Algorithmsも素晴らしい仕事をすることができます。


2
ビショップの+1。均等な詳細レベルで明確な開発。まだ良い間、私は常にHastieらを見つけました。少し途切れます。
共役前

1
+1-Hastie、Tibshirani、Friedmanは私の個人的なお気に入りです。
StasK

1
個人的にもお気に入りのHastie、Tibshirani、Friedmanを推薦するために+1も。その他の推奨事項に感謝します。統計学者以外の人(またはフィールドに入ったばかりの人)に推薦する良い本が本当に必要なので、私は彼らに読んでもらいます。
ネスター

1
ビショップの+1。それは実際には古典的な統計の素晴らしいソースでもありますが、更新されて変装しています。
推測

10

コンセンサスは、この質問が重複していないということであるように思われるので、機械学習初心者向けに私のお気に入りを共有したいと思います。

著者Toby Segaranは、中央のソフトウェア開発者ができるだけ早くデータハッキングに手を出せるようにすることに焦点を当てているため、Programming Collective Intelligenceは初心者にとって最も簡単な本だと思いました。

典型的な章:データの問題を明確に説明し、続いてアルゴリズムがどのように機能するかについて大まかな説明を行い、最後に数行のコードでいくつかの洞察を作成する方法を示します。

pythonを使用すると、すべてをかなり速く理解できます(pythonを真剣に知る必要はありません。真剣に、私もそれを知りませんでした)。DONTは、この本はレコメンダーシステムの作成にのみ焦点を当てていると考えています。また、テキストマイニング/スパムフィルタリング/最適化/クラスタリング/検証なども扱っているため、すべてのデータマイナーの基本的なツールの概要をわかりやすく説明しています。


6

Witten and Frank、「データマイニング」、Elsevier 2005は、本と一緒に使用できるコードのJavaライブラリ(Weka)があり、非常に実用的であるため、自己学習に適した本です。私が持っているものよりも新しい版があると思う。


1
はい、この本は「機械学習」と呼ばれていましたが、出版社によって名前が「データマイニング」に変更され、当時のデータマイニングの誇大広告に乗っていましたが、それでも本はMLではなくMLに関するものです(2つの類似点、しかし、異なるフィールドです!)。
clyfe

1
トム・ミッチェルの本「機械学習」も非常に良いです。スタイルは少し古めかしいですが、内容は素晴らしいです。
ディクランマースピアル

はい、Tom MitchellのMLはML聖書のようであり、現場で非常に包括的です!
clyfe


5

「統計学習の要素」は、あなたの目的にとって素晴らしい本です。2011年初頭に出版された本の第5版は、http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdfから無料で入手できます


2
数学の本なので、自習者が従うのは難しいかもしれません。
アティラオズグル

Springerが70ドルを請求したときに、Trevor Hastieの個人ページでどのように無料でダウンロードできるかを知っていますか?
アルフレッドM.

確かではありませんが、Springerがお金を欲しがっていると思います。著者は主に自分の本を広く公表したいと思っています。これは、Springerが発行された記事を販売する方法と非常によく似ていますが、多くの「ワーキングペーパーバージョン」が著者のWebサイトで無料で入手できます。
DanB

参考までに、ダウンロードは第2版​​の5回目の印刷用です。「私たちが信頼する神において、他のすべての人がデータをもたらす」という叙述の脚注が大好きです。これはデミングに起因しています。脚注は、デミングが実際にこれを言っていることを確認する「データ」が見つからないという皮肉を指摘しています。
HeatfanJohn

あなたは言及すべきであるRと統計的学習の概要を並べ替えの彼らのようなものだ--it ESLの(で数学場合-Lite ESLがあまりにも困難な場合)。
スティーブS 14年

5

ここに画像の説明を入力してください

多くの場合、機械学習の問題を解決する上で最も難しい部分は、仕事に適した推定量を見つけることです。異なるタイプのデータと異なる問題には、異なる推定量が適しています。以下のフローチャートは、データをどの推定量で試すかに関する問題へのアプローチ方法に関する大まかなガイドをユーザーに提供するように設計されています。以下の表の見積もりツールをクリックして、ドキュメントをご覧ください。



3

他の回答で言及されているほとんどの本は非常に優れており、実際にそれらのいずれかで間違って行くことはできません。さらに、Pythonの次のチートシートscikit-learn非常に便利です。


2

私は、ダダ、ハート、コウノトリの「パターン分類」が好きです。これは、すべてを非常によく説明する古典的なテキストの最近の改訂版です。ニューラルネットワークとSVMを多くカバーするように更新されているかどうかはわかりません。Hastie、Tibshirani、Friedmanによる本は最高のものですが、探しているものよりも少し専門的であり、主題の概要ではなく詳細です。


2

Microsoft Azureは、Anton Tarasenkoが投稿したscikit-learnに似たチートシートも提供しています。

Microsoft Azure Machine Learning Algorithmチートシート

(ソース:https : //docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet

彼らはそれに通知を伴います:

このアルゴリズムのチートシートで提供される提案は、おおよその経験則です。いくつかは曲がることができ、いくつかはひどく違反することができます。これは、出発点を示唆することを目的としています。(...)

マイクロソフトはさらに、詳細を提供する入門記事を提供します。

これらの資料は、Microsoft Azureに実装されているメソッドに焦点を合わせていることに注意してください。


1

統計学習の要素から始めないでください。それは素晴らしいですが、それはあなたが探しているもののように聞こえない参考書です。読みやすいので、Programming Collective Intelligenceから始めます。


ESLを参照テキストと見なすかどうかはわかりません。それは私にとってより概要のように思えます、すなわち、あなたは(ほとんど)何の核心な詳細を学ぶつもりはありません。幅広いテクニックと包括的なテーマが表示されます。
枢機

1

原理を説明するのに良い仕事をしている機械学習に関する最初の本のために、私は強くお勧めします

ロジャースとジロラミ、機械学習の最初のコース、(チャプマン&ホール/ CRC機械学習&パターン認識)、2011年。

クリス・ビショップの本、またはデビッド・バーバーの本は両方とも、原則を十分に理解すれば、より幅の広い本を選ぶのに適しています。




弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.