カードゲーム「戦争」の修正版の分析


13

通常子供たちがプレイする単純なゲームである戦争ゲームは、52枚のトランプの標準デッキを使用して2人でプレイされます。最初は、デッキがシャッフルされ、すべてのカードが2人のプレイヤーに2枚配られます。そのため、それぞれにランダムな順序で26枚のランダムカードがあります。各プレイヤーが両方のデッキのカードとカードの順序を知ることができるように、プレイヤーは両方のデッキを調べることができます(変更はできません)。これは通常、実際に行われるメモですが、ゲームのプレイ方法については何も変更せず、質問のこのバージョンを完全に決定論的に保つのに役立ちます。

次に、プレイヤーはそれぞれのデッキの一番上のカードを公開します。大きい方のカードを公開したプレーヤー(通常の順序:2、3、4、5、6、7、8、9、10、ジャック、クイーン、キング、エース)がラウンドに勝利し、最初にカードを置きます(デッキの一番下にある高いカード)、デッキの一番下にある相手のカード(低いカード)(通常、この順序は強制されませんが、この質問の最初のバージョンを決定論的に保つため、順序が強制されます)。

同点の場合、各プレイヤーは自分のデッキの上から4枚の追加カードを公開します。1人のプレイヤーが示す4枚目のカードが他のプレイヤーが示す4枚目のカードよりも高い場合、より高い4枚目のカードを持つプレイヤーがタイブレーカー中にプレイしたすべてのカードを獲得します。勝者のデッキ(先入れ先出し、つまり古いカードが一番下に配置されます)に続き、敗者のカードが(同じ順序で)続きます。

その後の同点の場合、同点の勝者が決定されるまでプロセスが繰り返されます。一人のプレイヤーがカードを使い果たし、引き分けを続けることができない場合、まだカードを持っているプレイヤーが勝者として宣言されます。両方のプレイヤーが同時にプレイするカードを使い果たした場合、ゲームはタイと宣言されます。

ラウンドは、1人のプレイヤーがカードを使い果たすまで(つまり、デッキにカードがなくなるまで)行われ、その時点で、まだカードを持っているプレイヤーが勝者として宣言されます。

ゲームについてこれまで説明してきたように、結果の決定にはスキルも運も関与していません。52枚のカードの順列の数には限りがあるため、最初にデッキに対処する方法には限りがあり、それに従っています(ゲーム内の唯一の状態情報は両方のプレイヤーのデッキの現在の状態なので)各ゲーム設定の結果はアプリオリに決定できます。確かに、戦争のゲームに勝つことと、同じトークンで負けることです。また、戦争のゲームがネクタイまたは無限ループになる可能性を残します。上記の完全に決定的なバージョンでは、そのような場合もそうでない場合もあります。

ゲームをより面白くしようとするゲームのいくつかのバリエーション(そして、いや、すべてが飲みゲームになるわけではありません)。ゲームをより面白くするために私が考えた1つの方法は、プレイヤーが特定のラウンドで自動「トランプ」を宣言できるようにすることです。各ラウンドで、いずれかのプレイヤー(または両方のプレイヤー)が「トランプ」を宣言できます。一人のプレイヤーが「切り札」を宣言した場合、そのプレイヤーはプレイされているカードに関係なくラウンドに勝ちます。両方のプレイヤーが「切り札」を宣言した場合、ラウンドは同点として扱われ、それに応じてプレイが続行されます。

プレイヤーのトランプ能力を制限するさまざまなルールを想像できます(無制限のトランプは、プレイヤーが毎ターントランプするので、常にタイゲームになります)。このアイデアに基づいて、異なるトランプ制限メカニズムを使用した戦争の2つのバージョン(私の頭のすぐ上。これらの線に沿ったより興味深いバージョンがおそらく可能です)を提案します。

  1. フリークエンシーウォー:プレイヤーは、前のラウンドでトランプしなかった場合にのみトランプすることができます。k
  2. Revenge-War:プレイヤーは、前のラウンドでラウンドに勝っていない場合にのみトランプすることができます。k

次に、上記の各バージョンに適用される質問について説明します。

  1. いくつかの可能な初期ゲーム構成のセットに対して、それを使用するプレイヤーが常に勝つような戦略はありますか(強く勝つ戦略)?もしそうなら、この戦略は何ですか?そうでない場合は、なぜですか?
  2. いくつかの可能な初期ゲーム構成のセットに対して、それを使用するプレイヤーが常に勝つか、または引き分けをすることができるような戦略がありますか(勝ち戦略)。もしそうなら、この戦略は何ですか?そうでない場合は、なぜですか?
  3. 彼らの初期のゲームの設定には必勝法(すなわち、任意の固定の戦略を用いるプレーヤーが存在しないようなものである常に一定の戦略を用いるプレーヤーで敗北することができますSが" )?もしそうなら、彼らは何であり、説明しますか?SS

明確にするために、私は「戦略」を、戦略を使用しているプレイヤーが何ラウンドで切り捨てるべきかを決定する固定アルゴリズムとして考えています。たとえば、「できる限りトランプ」アルゴリズムは戦略であり、アルゴリズム(ヒューリスティックアルゴリズム)です。私が尋ねている別の方法はこれです:

これらのゲームをプレイするための優れた(またはおそらく最適な)ヒューリスティックはありますか?

kk=0


代替バージョンもあります。両方のプレイヤーがトランプをプレイする場合、ルールは通常通りです(つまり、最高のカードが勝ちます)。
ジョー

@Joe素晴らしい提案!実際、より一般的には、代替バージョンは、プレイヤーがトランプする能力を獲得する方法を変更するだけでなく、同じターン中の両方のプレイヤーのトランプの処理方法を変更することによっても持つことができます。そのような分析は、ほぼ確実に他の点では同様のバージョンの分析を容易にするので、あなたが提示する状況の分析も提供してください。
Patrick87

回答:


7

私が正しく理解していれば、ゲームに関するすべての情報が両方のプレイヤーに利用可能です。つまり、開始構成と可能なすべての動きは、両方のプレーヤーに知られています(主に、両方のプレーヤーが他のプレーヤーのカードを見ることができるため)。これにより、ゲームは完璧な情報のゼロサムゲームになります。したがって、両方のプレイヤーが利用できる完璧な戦略が存在し、そのプレイヤーの各ゲームで最高の結果を達成します。これは、1912年にドイツの数学者エルンストツェルメロによって証明されました。

戦略が何であるかはわかりませんが、そのための大きなゲームツリーを構築し、コンピューターにmin-maxアルゴリズムを使用して戦略を見つけさせることを想像できます

各ゲームのツリーには、ルートとして2人のプレーヤーの手があります。ツリーの枝は、プレイヤーの動きに対応しています。最も単純な場合、これらは単に必要なカードを置くことから成ります。より高度なケースでは、「切り札」の動きをすることができます。ツリーの内部ノードは、カードの現在の構成が「切り札」である状態に関する情報とともに記録されます。ツリーの葉は、ゲーム終了位置に対応します。プレーヤー1への勝利の場合は+1、同点の場合は0、プレーヤー2への勝利の場合は-1のラベルが付けられます。ループゲームは無視してください。

これで、min-maxアルゴリズムは次のように機能します(プレーヤー1の観点から)。プレーヤー1が移動するノードを見て、その下のノードに+1、0、または-1の注釈が付けられていると仮定します(ペイオフ)指定された結果を得るためにプレイヤーが行う必要がある選択とともに。プレーヤー1は、最大のペイオフを持つノードを選択し、そのペイオフとその取得に必要な選択を記録するだけです。プレーヤー2が移動しているノードの場合、最小のペイオフを持つノードが選択され、選択が記録されます。これは、プレーヤー2が最低得点を目指していることを反映しています。これは、ツリーに伝播されます。各ノードで記録された選択は、プレーヤーが行うことができる最良の戦略に対応しています。最終的な見返りが勝者を決定します。これは最終的に見返りの観点からの関数ですが、正確な動きの選択は異なる場合があります。

既に見た構成に戻るループを追加するだけで、潜在的にループ構成をゲームツリーに組み込むことができます(トップから計算する場合)。このようなノードでは、プレーヤー1が再生するノードである場合は最大の固定点を、プレーヤー2を再生する場合は最小の固定点を使用します。

両方のプレイヤーが両方のデッキを調べることができると仮定していない場合、このアプローチは適用されないことに注意してください。その場合、ゲームにはチャンスが含まれ、選択された戦略はゲーム固有のものになります。

プレイヤーの1人に強いまたは弱い勝ち戦略があるかどうかは、すべての木に適用されたmin-maxアルゴリズムの結果に依存します。しかし、それらの多くは確かにあります...ゲームのために行われた選択はあまり多くないので、ツリーの計算はおそらくかなり簡単です。


自分でこれに答えようと試みた後、私はあなたが指摘したこと、つまり、必然的に最適な戦略が必要であるが、現実には、そのような戦略のルールを信じることは信じられないほど複雑であることに気付きました。また、これらのゲームのいくつかのバージョンでプレイヤーが行き詰まる可能性があるかもしれません...両方がトランプすることはできますが、トランプの構成がどうあるべきかについては同意できません't、もう1つが勝った場合、1つは勝ちます)。とても興味深い。
Patrick87
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.