ナッシュ均衡の計算限界バージョン?


14

ナッシュ均衡の概念の計算的に制限されたバージョンがあるかどうか、私は疑問に思っています。

ボードでプレイされ、最適なプレイがEXPTIMEハードであるという意味で複雑な、2種類の完全な情報ゲームを想像してください。また、簡単にするために、描画ができないと仮定します。このゲームを互いにプレイしているランダム化された多項式時間チューリングマシンのペアを想像してください。ごとに、を、ゲームでがに勝つ確率とします。(具体的には、が最初に確率0.5でプレイするとします。)クールだと思うのは、ペア存在を証明できればn×n(A,B)npABnABnAABランダム化された多項式時間チューリングマシン支配しないという性質(「が支配」は、すべての十分に大きいを) 、同様にランダム化された多項式時間チューリングマシンは支配しません(「は支配します」は、すべての十分に大きいを)。 A A ' A p A 'Bn > p A Bn n B ' B B ' B p A B 'n < p A Bn nA AAApABn>pABnnBBBBpABn<pABnn

どういうわけか、これは期待するには多すぎると思いますが、このような何かが真実であるため、おそらく制限されたクラスのゲームのために何か希望はありますか?

この質問の動機の1つは、特定のチェスのポジションが「白人にとって有利」であるという概念を形式化する方法を探していることです。古典的に、ポジションはホワイトの勝利か、そうでないかのどちらかです。ただし、チェスプレーヤーは、人間とコンピューターの両方が、ホワイトが優位性を持つことの意味を直感的に理解しています。プレイヤーが計算的に制限されており、最高の動きを推測しなければならないことを考えると、ホワイトが勝つ確率と関係があるようです。ランダム化されたアルゴリズムの特定のペアについては、もちろん白が勝つ確率について話すことができますが、私が疑問に思っているのは、ある意味で標準的なものがあるかどうかです 勝ちの確率がゲーム自体にのみ依存し、プレイヤーの特異性ではなく位置に値を与える計算的に制限されたプレイヤーのペア。


私が知っている計算的に制限された均衡の概念は、フレーバーの定理の神話の真理、2014年のようにHalpern、Pass、およびSeemanを考えることとは異なるフレーバーを持っています。難しい(与えられたゲームのために、そうでないかもしれない)。むしろ、プレイヤーが収益性の高い偏差を計算するのが難しい場合、戦略セットを均衡にすることができます。(これは指数戦略空間を前提としていることに注意してください。そうでなければ、すべての偏差をチェックできます。)
usul

回答:


1

この質問に対する簡単で完全にエレガントで満足のいく答えが得られる方法は考えられません。特に、最終的なペイオフの計算が非常に難しいためです。しかし、私の考えは長すぎてコメントとして投稿できません。

私が持っている最良のアイデアはこれです:チェスの場合、その正確な量の位置をランダムに選択することで、与えられた位置の白の物質的優位性(つまり、追加のポーン、騎士など)に基づいて白が勝つ確率を概算してみてくださいマテリアル構成。おそらく「全ルークのチェス」の場合、「黒の17のルークに対して8つのルークで白が勝つ可能性はどれくらいか」と言うことができます。おそらく、この確率は4%です。それを計算するには、(たとえば)8つの白いルークと17の黒いルークを持つランダムに生成された1000の異なるチェスの位置を調べ、次に(たとえば)あらゆる場合に10の深さを見て、新しいマテリアルの構成を確認する必要があります。次に、最後の材料構成に基づいて予想オッズを取り、

もちろん、材料ごとに、関連する可能性のための構成(見つけることが必要であろうMN)のM白ルックスNブラックルックス...おそらく最も低い順序対から始まる(M = 1、N = 1)、作業をそこから。

元の位置については、取得する統計値だけを使用しないでください(つまり、元の位置に(M = 6、N = 7)ルークがある場合、白の勝率が25%であると仮定しないでください) (6,7)の勝利の予想オッズ); 代わりに、より正確にできるので、この1つの位置だけで通常どおり10の深さを見て、可能なすべての終了位置を見つけます。次に、10ムーブディープ構成への正しいパス(両側で最適なプレイを含む)を見つけ、このパスの予想オッズを元の位置の予想オッズとして選択します。

このプロセスは多項式時間で実行できると思います。探しているk個の深い固定のために移動するKチェスでは、基板のサイズの多項式であり、その数は、ボードのサイズよりも小さくなければならないので、白と黒のルックスの総数は(意味で)単項で発現されます。

これが複雑で説明が難しいように思えるのは、それが理由です。私が説明していることのより簡潔な要約は次のとおりです。ボード上のM個の白いルークとN個の黒いルークが与えられた場合、白人の勝利の確率を計算するために再帰と基本統計を使用します。次に、これらの値を使用してkの動きを深くし、元の位置で白が勝つ可能性を確認します。

最終コメント:この問題は、WikipediaによればPSPACE完全であるtic-tac-toeなど、EXPTIME完全ではないゲームでも興味深いと思います。さらに、三目並べで「物質的な」利点を得ることが不可能であることは明らかですが、上記で説明したようなプロセスも有用であると考えています。Xの位置またはOの位置の優位性を判断するための他の基盤が必要です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.