最高の「実用的な」動きを見つけるエンジンはありますか?


25

標準のチェスエンジンは、両側からのベストプレイを想定して、ベストと考える動きを見つけます。しかし、この動きは取るに足りない利点や、特定の能力を持つ人間のプレイヤーにとって間違いを招く可能性があるトリッキーなラインにつながる可能性があります。中級プレイヤーなどに最適な「実用的な」動きを見つけるプログラムはありますか?たとえば、完璧なプレーで防御できたとしても、相手が間違いを犯す可能性が非常に高い攻撃位置につながる動きを選択する可能性があります。


5
非常に興味深い質問ですが、「実用的」は状況によって非常に異なる可能性があるため、このようなものを実装することは難しいと思います。例えば、同じ動きが200ポイント上の敵と200ポイント下の敵に対して等しく実用的でしょうか?古典的なゲームと電撃戦はどうですか?
アカバル

minimaxよりexpectimaxに近いものが欲しいですか?
Mehrdad

これはポーカーを思い出させます。ほとんどのポーカーボットは、ナッシュの均衡を仮定して理論上の最高の動きをしようとするのではなく、常に実用的な動きをしていると思います。
ポール

これについて考える1つの方法は、異なる目的関数を定量化することです。負けているときは、負けている量を最小限に抑えたくありません(センチポーンまたはクイーンで負けた場合は誰が気にしますか)。代わりに、相手が合理的に負ける可能性のあるラインがまだあることを条件に、負けている量を最小限に抑える必要があります。「合理的にfall落」を定量化するには、「唯一の」動き、またはトップの動き(または2つ)のみが優位性を維持し、他の動きが優位性をもたらす状況をカウントします。
ddunn801

類推として、アメリカンフットボールでは、キックがオンサイドキックされます。なぜなら、予想される結果があなたを悪化させたとしても、素早く得点する(スリムな)機会を与えるからです。
ddunn801

回答:


22

あなたは軽emptに非常に似ている何かを説明しています。軽withのアイデアは、ポジションにもっとダイナミズムを保つと、弱い相手がミスを犯しやすくなり、それを悪用できるということです。したがって、同様の評価をもたらす2つの動きを考えると、軽highスコアの高いエンジンは、その位置でより多くのダイナミズムを保持するものを選択します。現在最も強力な従来のエンジンにはすべて軽が実装されています(Komodoの例)。

辱の危険性は、強い敵に対して、高い辱はあなたを殺すことができるということです-あなたは結局、ゲームを生き続けるためだけにエンジンに弱い動きを強いることになります。


1
おかげで、それは私が探しているものに似ていますが、私の質問は同じ能力のプレイヤーですらあります。たとえば、1回の動きは、相手が行う可能性のある動きを考慮して9/10倍の勝利につながる可能性があります。
アリ

3
@アリも似ています。2つの動きを取ります。1つは引き分けになり、もう1つは90%の確率で勝ち、残りの10%を失うことになります。軽high的な設定が非常に高いエンジンは、後者を選択する可能性があります(完全な防御に対しては負けます)。
アリュール

1
軽emptのエンジンがなければ、おそらく、どの時点でも強制的な繰り返しを排除しないことで、劣った相手に対してほとんどのゲームを引き寄せることになるでしょう。
慣性無知

1
他のプレイヤーが時間切れになっている場合、非常に良いかもしれません。
イアンリングローズ

@Ari対戦相手があなたと同じレベルにいる場合、ラインのメタ分析を行うことができる場合(つまり、勝者であるかどうかを決定するだけでなく、対戦相手が勝者であると認識する可能性を推定する)、おそらくそれを分析できるでしょう。
累積

6

この質問は、主に動きを評価するためにミニマックス関数を使用する標準チェスエンジンに適用されることに気付きました。ただし、alphazeroのようなチェスエンジンは、モンテカルロツリー検索を使用して多くの異なるゲームをシミュレートするため、可能な限り最高の動きを見るだけではありません。彼らはすでに最良の「実用的な」動きを見つけるために使用される可能性があり、またはそれらはその目的に適応できる可能性があります。たとえば、モンテカルロ検索アルゴリズムを更新して、「合理的な」動きを見て、何が起こるかをシミュレートできます。



ただし、アルゴリズムに「合理的な」プログラムを作成する必要があります。
慣性無知

1

あんまり。

データベースは、移動が頻繁に行われ、その結果が何であるかを伝えることができるため、便利ですが、さまざまな理由で完璧ではありません。

Fritz 12(後のバージョンについてはわかりません)には、バリエーションがどれほど複雑かを示す「ホットネス」メーターがあります。

一番下の行。それは物事の組み合わせです。最も原則的な動きが悪いことが判明した動きを探しています。それを伝えるエンジンはありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.