強化学習に慣れるための良いリソースは何ですか?


8

私は教師ありおよび教師なしの学習に精通しています。私はCoursera.orgでAndrew Ngが行ったSaaSコースを受講しました。

私は強化学習のために似たようなものを探しています。

何かお勧めできますか?

回答:


5

ここで良い答えに、私は追加します

これらはRLの表面をかろうじて引っ掻きますが、あなたが始めるのに役立つはずです。


3

ディープマインドチャンネルに)Youtubeプレイリストがあり、タイトルは「はじめに強化学習」です。これは、デビッドシルバーによる強化学習のコース(10レッスン)です。

コースをフォローして終了した人は、(YouTubeのコメントとして)次のように書いています。

素晴らしいコース。優れた直感を提供するのに十分なペースの十分な例であり、ゲームにRLを適用することで分野をリードしている誰かから教えられました。


3

その前に、「強化学習」について本当に学びたいかどうか自問してください。強化学習については誇大宣伝がありますが、強化学習の実際の適用性はほとんどありません。ほとんどのオンラインコースでは機械学習についてはほとんど触れられていないため、強化学習に進むよりも、機械学習を完全に理解する方がはるかに優れています。強化学習の学習は、教師なし/教師あり学習手法の学習とは多少異なります。

そうは言っても、強化学習を十分に理解するための最も速い方法は次のとおりです。

  1. Andrej Karpathyのブログ投稿「Pong from Pixels」を読んでください

  2. ウォッチディープRL合宿講義します

  3. これらの手法の背後にある数学を理解するには、サットンとバルトの強化学習:はじめにを参照してください。

  4. 関連する論文(ゲームプレイなど)を読んでください。

PS:RLの現在の論文のほとんどはDNNを何らかの方法で近似子として使用しているため、ニューラルネットワークの基本を十分に理解していることを確認してください。


real-world applicability of reinforcement learning is almost non-existent AlphaGoは強化学習で訓練されました。
cantordust

おかげで、強化学習について私が好きなのは、タスクを何度も繰り返すだけで改善できることです。監督は必要ありません。モデルのみが問題を正しく説明する必要があります。
マーティンS

1
@cantordust、チェックalexirpan.com/2018/02/14/rl-hard.html
riemann77

@thecomplexitytheoristはい、私はその投稿を認識しています。そして、はい、RLに関連する問題があります(他のMLメソッドと同様)。ただし、これらの問題は、その適用性がゼロであることを意味するものではありません。もう1つの成功した例(投稿でも言及)は、Googleのデータセンターの冷却効率が40%向上したことです
cantordust

1
@cantordust、その投稿を完全に読む必要があります。「冷却効率の向上」に関連する「強化学習」の学習はありません。彼らは、過去の電力消費データに基づいて予測を行ったことを明確に述べています。
riemann77 2018


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.