編集
コメント内の@unutbuのリンクは、入門としてよく読まれています。
AlphaZeroをしっかり理解するには、おそらく定量的な学位(PhD?)が必要です。AlphaZeroの短期集中コースを求めていますか?
あなたがかなりの時間を費やさない限り、私が言うことは何もうまくいきません。すべてをカバーできる本はありません。あなたは一生懸命働く必要があるでしょう。
やってみましょう。AlphaZeroのクラッシュコース。
1.機械学習の基本的な理解
無数の本。時間がない場合は、Andrew Ng教授のコースラでの機械学習コースをお勧めします。
キーワード:トレーニングセット、テストセット、確率的勾配降下法、学習率、GPU、コスト関数、クロスエントロピー。
2.ディープニュートラルネットワーク
ニューラルネットワークについて理解する必要があります。本気なら、イアン・グッドフェロー教授のディープラーニング本をお勧めします。時間がない場合は、CourseraのAndrew Ng教授のオンラインコースをもう一度フォローしてください。すべての章を通過する必要はありません(ただし、そうする必要があります!)。
YouTubeにはニューラルネットワークの簡単な紹介がたくさんあります。ぜひお試しください。
キーワード:ニューロン、レイヤー、重み、バイアス、ミニバッチ、アクティベーション。
3.モンテカルロツリー検索
モンテカルロとは何かを理解する必要があります。モンテカルロに関する本はAmazonのいたるところにあります。時間がない場合は、MCTSに関するウィキペディアを読んでください。
キーワード:サンプリング、拡張、シミュレーション、ロールアウト、バックプロパゲーション。
3.強化学習
キーワード:政策勾配、勾配降下、学習率
5.チェス盤の表現
紙自体は最も単純です。モデルは、ボードの状態(ピースなど)を一連のワンホットエンコーディングバイナリ値としてエンコードします。
6. MCTSとアルファベータ