モンテカルロツリー検索:どのような動きが簡単に見つかり、どのような種類の問題が発生しますか?
まず、MCTSのパフォーマンスを考えさせるシナリオから始めたいと思います。検索ツリーにまだ追加されていない移動があるとしましょう。一部のレイヤー/移動が深すぎます。しかし、私たちがこの動きをするならば、ゲームは基本的に勝ちます。ただし、所定のゲーム状態で代わりに取ることができるすべての動きが非常に悪いと仮定します。議論のために、1000の可能な動きがあり、そのうちの1つだけが良い(しかし非常に良い)で、残りは非常に悪いとしましょう。MCTSはこれを認識できず、この動きに向かって検索ツリーを拡大し、このサブツリーを非常にひどく評価しますか?MCTSは最終的にミニマックスに収束することを知っています(十分なメモリがある場合、最終的にはツリー全体を構築します)。次に、悪い可能性がたくさんあるとしても、その動きが良いことを知っているはずです。しかし、実際には、これは信頼できるものではないと思います。多分誰かがこれが私の側の正しい評価であるかどうか私に言うことができます。 この特別なシナリオとは別に、MCTSのパフォーマンスが悪い(または並外れた)他のシナリオがあるかどうかも知りたいです。