ゲームのプレイの問題を解決する方法はいくつかあります。一部のゲームは、たとえば検索アルゴリズムによって解決できます。これは、ある程度の複雑さまでのカードゲームとボードゲームに適しています。たとえば、IBMのディープブルーは、本質的に、最適な移動のための高速なヒューリスティック駆動の検索でした。
ただし、エージェントをトレーニングしてタスクを最適に実行するための最も一般的な機械学習アルゴリズムは、強化学習です。技術的には1つのアルゴリズムではなく、学習問題の特定の形式化をすべて解決する関連アルゴリズムの拡張ファミリです。
非公式には、強化学習(RL)は、環境の状態を観察し、その環境でアクションを実行し、何らかの形で状態とアクションに関連する報酬を体験できるエージェントに関して定義された問題に対する最適なソリューションを見つけることです。RLソルバーは、重要なアクションが実行されたときよりも後で報酬が受け取られる状況に対処するように設計する必要があります。これは通常、状態および/または状態とアクションのペアに関連付けられた後の報酬の内部期待を学習するアルゴリズムによって達成されます。
強化学習を学習するためのリソースを以下に示します。
解決する問題が難しくなるにつれて、アルゴリズムのますます高度なバリエーションが必要になるため、主題自体が非常に大きいことがわかります。
強化学習を研究するためのゲームの開始には、次のようなものがあります。
ビデオゲームをプレイするためにエージェントと連携したい場合は、ニューラルネットワークについても知りたいと思います。詳細については、スクリーングラフィックスを処理するための深い畳み込みニューラルネットワークが必要です。
RLの比較的新しいリソースはOpenAI Universeです。彼らは、エージェントをトレーニングする準備が整った環境をパッケージ化するために多くの作業を行いました。つまり、環境をセットアップするのではなく、学習アルゴリズムの学習に集中できます。
現在のスキルのリストについて:強化学習に直接関連するものはありません。しかしながら: