私はかなり前から強化学習を理解しようと努めてきましたが、どういうわけかグリッド世界の問題を解決する強化学習のためのプログラムの書き方を視覚化することができません。強化学習の明確な概念を構築するのに役立つテキストブックをいくつか教えてください。
私はかなり前から強化学習を理解しようと努めてきましたが、どういうわけかグリッド世界の問題を解決する強化学習のためのプログラムの書き方を視覚化することができません。強化学習の明確な概念を構築するのに役立つテキストブックをいくつか教えてください。
回答:
ここに、強化学習に関するいくつかの良い参照があります:
クラシック
Sutton RS、Barto AG。強化学習:はじめに。マサチューセッツ州ケンブリッジ:ブラッドフォードの本。1998. 322 p。
第2版のドラフトは無料で入手できます。http://incompleteideas.net/book/the-book-2nd.html
ラッセル/ノーヴィーグ第21章:
Russell SJ、Norvig P、Davis E.人工知能:現代的なアプローチ。ニュージャージー州アッパーサドルリバー:プレンティスホール; 2010。
より技術的
SzepesváriC.強化学習のアルゴリズム。人工知能と機械学習に関する総合講義。2010; 4(1):1–103。 http://www.ualberta.ca/~szepesva/RLBook.html
Bertsekas DP。動的プログラミングと最適制御。第4版。マサチューセッツ州ベルモント:Athena Scientific; 2007. 1270 p。 第6章、第2巻は無料で入手できます。http://web.mit.edu/dimitrib/www/dpchapter.pdf
最近の開発について
Wiering M、van Otterlo M、編集者。強化学習。ベルリン、ハイデルベルク:Springer Berlin Heidelberg; 2012から入手可能:http : //link.springer.com/10.1007/978-3-642-27645-3
Kochenderfer MJ、Amato C、Chowdhary G、How JP、Reynolds HJD、Thornton JRなど 不確実性の下での意思決定:理論と応用。1エディション。マサチューセッツ州ケンブリッジ:MITプレス。2015. 352 p。
マルチエージェント強化学習
BuşoniuL、BabuškaR、Schutter BD。マルチエージェント強化学習:概要。編集者:Srinivasan D、Jain LC、編集者。マルチエージェントシステムとアプリケーションの革新-1。スプリンガーベルリンハイデルベルク; 2010 p。183–221。利用可能:http : //link.springer.com/chapter/10.1007/978-3-642-14435-6_7
シュワルツHM。マルチエージェント機械学習:強化アプローチ。ニュージャージー州ホーボーケン:Wiley; 2014。
ビデオ/コース
YouTubeのDavid Silverコースもお勧めします:https : //www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa
Udacityによる強化学習に関する無料のオンラインコースがあります。チェック:機械学習:強化学習
Reinforcement Leraning: Richard Suttonによる紹介を本当に楽しんだ。最新のアプローチについては触れられていませんが(1998年から)、RLに関する非常に優れた統合ビューを提供します。
最初から強化学習をゼロから高度な最先端の深層強化学習アルゴリズムまで説明した、私の本-Pythonを使用した実践的な強化学習をチェックしてください。
すべてのコードと説明は、すでにgithubリポジトリで入手できます。 https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python