三目並べ、チェス、リスク、その他のラウンドベースのゲームなど、ラウンドベースのボードゲームのニューラルネットワークをトレーニングする方法を知りたいです。推論によって次の動きを取得することは、ゲームの状態を入力としてフィードし、出力を現在のプレーヤーの動きとして使用することで、かなり簡単に思えます。ただし、その目的でAIをトレーニングすることは、それほど単純ではないように見えます。
- シングルムーブが良いかどうかは評価がないため、シングルムーブのトレーニングは正しい選択ではないようです。
- ゲーム全体のすべてのゲーム状態(入力)と動き(出力)を使用してニューラルネットワークをトレーニングすることは、失われたゲーム内のすべての動きが悪いとは限らないため、適切な選択ではないようです。
それで、ラウンドベースのボードゲームのニューラルネットワークをトレーニングする方法を知りたいですか?tensorflowを使用して、tic-tac-toeのニューラルネットワークを作成したいと考えています。