強化学習の教科書


12

強化学習の教科書・講義ノートを探しています。私は「統計学習入門」が好きですが、残念ながら彼らはこのトピックをカバーしていません。私はサットンとバルトの本が標準的な参考あることを知ってます、そしておそらくNDPも良いですがそれらは1997-98年のものです、そしてこの分野は最近かなり発展している可能性が高いのでもっと現代の博覧会を見つけたいと思っていました時間。

回答:


15

サットンとバルトはまだ標準だと思います。オンラインのAIクラスからのスライドデッキやメモはたくさんありますが、通常はあまり詳しく説明していません。

サットンとバルトは少し古いですが、彼らは彼らの教科書の第2版を準備しています。2018年1月付けのドラフトはこちらから入手できます。これは、初版の全文も掲載されているサットンのウェブページからリンクされています。

Kochenderferらの「不確実性の下で意思決定」に取り組む前に、私はこれを検討します。その本にはいくつかの興味深いアプリケーション(主に航空分野)がありますが、素早く動き、多くの範囲で跳ね回ります。Szepesváriの強化学習アルゴリズムも優れていますが、簡潔です。に到達するまでに約20ページかかります。新しいSuttonとBartoでは、7つのchapersと150ページが必要です。TD(λ)

それ以外に、いくつかの論文に飛び込むことを試みるかもしれません-強化学習のものはかなりアクセスしやすい傾向があります。


ありがとう、私は新しい版を見てみましたが、それが大幅に更新されたとは言えません。私はまだもっと最新の露出に興味があります。
ユリシーズ

確かに完全なオーバーホールではありませんが、Springerの "Lecture Notes"のいくつかのボリューム以外に何も思い浮かびません。他に何か見つかったら、アップデートを投稿してください。ぜひチェックしてみてください。
Matt Krause

なるほど、きっとやるよ
ユリシーズ

1
@CharlieParker、わかりません。最新のドラフト(2017年6月19日)はかなり完成しているように見え、MIT Pressについて言及していますが、MIT Pressサイトはまだ初版を販売しているようです。価値があるのは、草稿が著者の公開Webサイトから直接提供されているため、「漏出」バージョンなどの使用について心配する必要はないということです。
Matt Krause 2017

1
@トーマス、私は新しいドラフトでリンクを更新しました。
Matt Krause

6

2010年に発行されたCsabaSzepesváriによる強化学習のアルゴリズムを確認してください。PDFはWebサイトからダウンロードできます。私の意見では、SuttonやBartoより少し技術的ですが、カバーする内容は少ないです。


6

ここにあなたはいくつかの良い教科書/参照があります:

クラシック

Sutton RS、Barto AG。強化学習:はじめに。マサチューセッツ州ケンブリッジ:ブラッドフォードの本。1998. 322 p。

第2版​​のドラフトは無料で入手できます。https//webdocs.cs.ualberta.ca/~sutton/book/the-book.html

ラッセル/ノーヴィーグ第21章:

Russell SJ、Norvig P、Davis E.人工知能:現代的なアプローチ。ニュージャージー州アッパーサドルリバー:プレンティスホール; 2010。

より技術的

SzepesváriC.強化学習のアルゴリズム。人工知能と機械学習に関する総合講義。2010; 4(1):1–103。 http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP。動的プログラミングと最適制御。第4版。マサチューセッツ州ベルモント:Athena Scientific; 2007. 1270 p。 第6章、第2巻は無料で入手できます。http//web.mit.edu/dimitrib/www/dpchapter.pdf

最近の開発について

Wiering M、van Otterlo M、編集者。強化学習。ベルリン、ハイデルベルク:Springer Berlin Heidelberg; 2012から入手可能:http : //link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ、Amato C、Chowdhary G、How JP、Reynolds HJD、Thornton JRなど 不確実性の下での意思決定:理論と応用。1エディション。マサチューセッツ州ケンブリッジ:MITプレス。2015. 352 p。

マルチエージェント強化学習

BuşoniuL、BabuškaR、Schutter BD。マルチエージェント強化学習:概要。編集者:Srinivasan D、Jain LC、編集者。マルチエージェントシステムとアプリケーションの革新-1。スプリンガーベルリンハイデルベルク; 2010 p。183–221。利用可能:http : //link.springer.com/chapter/10.1007/978-3-642-14435-6_7

シュワルツHM。マルチエージェント機械学習:強化アプローチ。ニュージャージー州ホーボーケン:Wiley; 2014。

ビデオ/コース

YouTubeのDavid Silverコースもお勧めします:https : //www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.