MCTS / UCTは、バンディットアルゴリズムを使用して探索する有望なノードを選択するゲームツリー検索方法です。ゲームはランダムに最後までプレイされ、より多くの勝利につながるノードがより深く探索されます。バンディットアルゴリズムは、高い勝率を持つノードの探索と未知のノードの探索の間のバランスを維持します(純粋な形式では、必ずしもヒューリスティック評価関数を使用しません)。この一般的な手法に基づくプログラムは、コンピューターGoで驚くべき結果を達成しています。
バンディット主導のモンテカルロ検索は、他の検索問題に適用されましたか?たとえば、MAX-SAT、BKP、または他の組み合わせ最適化問題のソリューションを近似するのに役立つアプローチでしょうか?山賊スタイルのアプローチが効果的であるかどうかを示唆する問題(構造的/統計的など)の特定の特性はありますか?
ソリューションスペースの性質上、バンディットメソッドに完全に耐性がある既知の確定的な問題はありますか?