タグ付けされた質問 「monte-carlo-tree-search」

1
「モンテカルロ検索」はどのように機能しますか?
Alpha Goに関するRedditの投稿で、この概念について聞いたことがあります。私は論文と記事を調べようとしましたが、アルゴリズムの意味を本当に理解できませんでした。 だから、誰かがモンテカルロ検索アルゴリズムがどのように機能し、ゲームプレイAIボットの構築にどのように使用されているのかを簡単に説明できますか?

3
チェッカーのようなボードゲームに最適なアルゴリズムを選択するにはどうすればよいですか?
チェッカーのようなボードゲームに最適なアルゴリズムを選択するにはどうすればよいですか? これまでのところ、ミニマックス、アルファ-ベータプルーニング、およびモンテカルロツリー検索(MCTS)の3つのアルゴリズムのみを検討してきました。どうやら、アルファベータプルーニングとMCTSの両方は、基本的なミニマックスアルゴリズムの拡張機能です。

1
モンテカルロツリー検索:どのような動きが簡単に見つかり、どのような種類の問題が発生しますか?
まず、MCTSのパフォーマンスを考えさせるシナリオから始めたいと思います。検索ツリーにまだ追加されていない移動があるとしましょう。一部のレイヤー/移動が深すぎます。しかし、私たちがこの動きをするならば、ゲームは基本的に勝ちます。ただし、所定のゲーム状態で代わりに取ることができるすべての動きが非常に悪いと仮定します。議論のために、1000の可能な動きがあり、そのうちの1つだけが良い(しかし非常に良い)で、残りは非常に悪いとしましょう。MCTSはこれを認識できず、この動きに向かって検索ツリーを拡大し、このサブツリーを非常にひどく評価しますか?MCTSは最終的にミニマックスに収束することを知っています(十分なメモリがある場合、最終的にはツリー全体を構築します)。次に、悪い可能性がたくさんあるとしても、その動きが良いことを知っているはずです。しかし、実際には、これは信頼できるものではないと思います。多分誰かがこれが私の側の正しい評価であるかどうか私に言うことができます。 この特別なシナリオとは別に、MCTSのパフォーマンスが悪い(または並外れた)他のシナリオがあるかどうかも知りたいです。

3
モンテカルロツリー検索は機械学習の資格がありますか?
私の理解の及ぶ限りでは、モンテカルロツリー検索(MCTS)アルゴリズムは、ノードのツリーを検索するためのミニマックスの代替手段です。これは、手(通常、最高になる可能性が最も高い手)を選択し、その手でランダムなプレイアウトを実行して結果を確認することで機能します。このプロセスは、割り当てられた時間だけ続きます。 これは機械学習のようには聞こえませんが、ツリーをトラバースする方法です。しかし、AlphaZeroがMCTSを使用していると聞いたので、混乱しています。AlphaZeroがMCTSを使用する場合、AlphaZeroはなぜ学習するのですか?それとも、AlphaZeroは、試合を行う前に何らかの機械学習を行ってから、機械学習から得た直感を使用して、MCTSでより多くの時間を費やすためにどの動きをするかを知りましたか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.