トリプレットのゲームでの勝利戦略


8

トリプレットゲームは、要素の有限セットと、要素のトリプレットを含む有限のマルチセットによって定義されます。2人のプレイヤーが交代でXから要素を選択し、すべての要素を取得します。次に、各プレーヤーのスコアは、Tからのトリプレットの数であり、Tには少なくとも2つの要素があります。XTXT

標準の戦略を盗む引数は、最初のプレーヤーが常に少なくとも|T|/2獲得できることを示しています。それが偽であると矛盾して仮定します。次に、2番目のプレーヤーは|T|/2超えるスコアを獲得できます。しかし、その後、最初のプレーヤーは、2番目のプレーヤーの勝利戦略をコピーして、|T|/2以上のスコアを獲得できます。スコアの合計が|T|であるため、これは矛盾です

質問:最初のプレーヤーが少なくとも|T|/2スコアを得るための明示的な戦略は何ですか?

編集:最初のプレーヤーが少なくとも3|T|/8を得るための明示的な戦略は次のとおりです。T各トリプレットに、(最初、2番目の)プレーヤーが取った要素の数に基づいて、潜在的なP(a,b)を割り当てます。

ab012303/800013/41/2021131
最初は、すべてのトリプレットはポテンシャル3/8持っているので、ポテンシャル合計は3|T|/8

プレーヤー1の戦略は、ポテンシャル合計を最大化する要素を選択することです。elementがxで、プレーヤー2が次にピックするelementがyます。これら2つの動きの後の潜在的な合計は弱く増加すると主張します。

  • xyも含まないトリプレットのポテンシャルは変化しません。
  • xy両方を含むトリプレットのポテンシャルは、P(a,b)からP(a+1,b+1)に変化します。これは常に少なくとも同じ大きさです。
  • yではなくxを含むトリプレットのポテンシャルは、P(a + 1、b)-P(a、b)だけ増加します。yP(a+1,b)P(a,b)
  • ではなくを含むトリプレットのポテンシャルは、減少します。であることをテーブルで確認するのは簡単です(右に行くときの減少は最大で下降時の増加)。yxP(a,b)P(a,b+1)P(a,b)P(a,b+1)P(a+1,b)P(a,b)

全ての和によって電位和が増加し、全部で含まれているすべてのトリプレット上、そして(最大で)減少の和を含むすべてのトリプレット。の選択により、最初の合計はわずかに大きくなります。したがって、潜在的な合計は弱く増加します。P(a+1,b)P(a,b)xP(a+1,b)P(a,b)yx

したがって、最終的なポテンシャル合計は少なくともです。最後に、トリプレットはプレーヤー1(2)が勝った場合に限りポテンシャル()を持つため、最終的なポテンシャル合計はプレーヤー1のスコアと等しくなります。3|T|/810


1
戦略を盗むことで最初のプレイヤーが常に勝つことができることを証明するほとんどのゲームの場合のように、1つの単純な戦略があることはほとんどありません。
domotorp

私はdomtorpに同意します。「発生数が最も多い要素を取得する」が正しい基本的なヒューリスティックですが、発生数は正確にカウントするためのものではありません。戦略を盗む引数は、通常、特定のヒューリスティックに従うと、挑戦されたときに常に防御的にプレーして勝つことができることを意味します。問題は、いつどのようにディフェンスでプレーするかを理解することです。
Stella

以前のコメンターに加えて、このタイプのゲーム(「I cut you choose」以外の自然なフレームワークで戦略を盗む)がPSPACE完了(たとえば、 →最初に勝利)であることが証明されれば、非常に興味深いでしょう。PSPACE完了で移動します)。T
Dmytro Taranovsky

回答:


3

これは完全な証明ではありませんが、既知の推測がゲームの計算を解決するのが難しいかもしれないことを示唆する理由の正当化を以下に示します。つまり、正しい最初の動きを見つけるのはおそらくおそらくトリッキーであると主張します。


最初のステップとして、トリプレットゲームは(適切な意味で)次のように定義されたゲームよりも難しいと主張します。Denser Induced Subgraph

AとBの2人のプレイヤーが、共通のグラフGで頂点を交互に選択します。頂点は一度だけ選択できます。選択する頂点がなくなると、各プレーヤーの選択によって誘導されたサブグラフが比較されます。誘導エッジの数が多いプレーヤーが勝者と宣言されます。

証明の概要:

インスタンス所与グラフでゲーム、我々は、コンストラクト次のようにインスタンス。一般性を失うことなく、に孤立した頂点がないと仮定します。インスタンスの要素のセットはます。頂点と間の各エッジは、とという形式の2つのトリプレットがあります。さらに、各頂点について、という形式の4つのトリプレットを追加します。これで削減は完了です。Denser Induced SubgraphG=(V,E)TripletsGV(E×{0,1})eEuv(u,v,(e,0))(u,v,(e,1))vV(v,v,v)

ゲームの進行状況を想像してみてください。からの一部の頂点が選択されていない限り、そのような頂点の選択がからの要素の頂点を厳密に支配します。実際、から要素を選択すると、スコアが増加する可能性があります(また、対戦相手を最大ポイントからブロックします)。一方、から要素を選択すると、自動的にスコアが増加します、より多くの可能性。TripletsVEE×{0,1}11V4

したがって、最適なプレイでは、最初のラウンドは、から要素を選択する両方のプレーヤーに対応します。これらのラウンドの後、プレーヤーは交互に、まだ要求されていないトリプルの偶数サイズのコレクションをピックアップします。これは、各プレーヤーによってエンドポイントが一度選択されたエッジに正確に対応しています。ここでの合理的な戦略は、どちらのプレイヤーにとっても、利用可能なトリプレットのちょうど半分を拾うことになります。ゲームは、すでにピックアップされたトリプレットでの一連のNOOPムーブで終了します。|V|V

LETプレイヤAによって選択された頂点とすること(i)は、プレイヤAのスコアは、の和であるから選択される頂点ごとに4つの点Bによって選択されたものトリプレット(II)ごとに2つの点をこれらの頂点から作成された誘導エッジ、および(iii)各分割エッジに1つのポイント。したがって、スコアは、ここではによって誘導されたエッジのセットです。最初と最後の項は最終的には両方のプレーヤーで等しいため、より大きな誘導サブグラフを持つプレーヤーが勝ちます。VAVB(v,v,v)4|V|/2+2|E[VA]|+(|E||E[VA]||E[VB]|)E[S]S


これを念頭に置いて、密な部分グラフの検出に関する文献のいくつかの研究にアピールできます。この点については多くの関連する作業がありますが、分析を簡単にするために、疎なランダムグラフで密なランダムグラフを見つけることの難しさについて、特定の予想に訴えます(この依存関係は削除できると思います)もう少し考えてみますが、これは正式な証明となることを意図したものではありません)。

植え付けられた密な部分グラフ問題(非公式)。LETオルドス-レーニイ分布からサンプリングされたランダムグラフである。確率、そのまま返します。それ以外の場合は、をサイズ一様にランダムなサブセットとします。ペアごとに、エッジを独立して確率追加します。そうして初めて、を返します。問題は、上記の出力のみを与えられて、Erdos-Renyiグラフが拡張されたかどうかを正しく識別することです。G=(V,E)G(n,1/n)1/2GVVnu,vV(u,v)En1/4G

Planted Dense Subgraph Conjecture(非公式)。多項式時間アルゴリズムは、少なくとも確率でPlanted Dense Subgraph問題を解くことができません。51%

グラフが拡張され、異常に密度の高いコンポーネントがあるとします。ポリタイムアルゴリズムでは、この密なサブグラフの存在を確実に検出できないため、この自己密性により、この密なコンポーネントから頂点を確実にサンプリングすることもできません。したがって、(プレーヤーAの観点から)純粋なErdos-Renyiグラフからランダムな頂点を選択しているので、どの頂点Aが選択するかはあまり問題ではありません(スコアリングの小さな変更までは問題になりません1))。ただし、プレーヤーBが全知の場合、最初のショットで密集したコンポーネントから頂点を確実にサンプリングできます。このプロセスは、Bの選択が密なコンポーネントのAへの公開を開始する前に、超定数を繰り返します(そうでない場合、多項式時間アルゴリズムは、このゲームツリー内のすべてのパスを一定の深さまでトラバースして、Planted Dense Subgraph問題を解決できます)。Aが追いつく前にプロセスが回繰り返された場合、最初のラウンドはBの「景品」ラウンドと見なすことができます。一方、番目のラウンドは、AとBが高密度コンポーネントをめぐって戦い始め、Bが取得されます。最初の動きと(戦略を盗むことによる)勝利のサブセット。rr1r

密なコンポーネントが使い果たされると、2人のプレイヤーは残りのグラフをめぐって戦いを再開します。Aが選択されているが Bが有するよりも、ここで複数の頂点を、Bの最初の頂点は価値がある限り倍、従ってBは、最終的に勝者です。rrΩ(n1/4)

1.ある種の集中とピジョンホールの議論により、最初の選択と2番目の選択の違いは、最終スコアで超えてはなりません。O(1)


したがって、プレーヤーAのゲームは非常に弱く解決されていますが、Aが勝利戦略の最初の動きでさえも計算上実行できるとは考えられません。

「通常の」最も密度の高い部分グラフ問題の硬度に基づくアプローチも、ここで達成することは難しくないはずであり、近似結果の硬度で還元を構成することは、より主流の推測に基づいてある種の硬度を得るために使用できる可能性があります(例:ETH)。NP硬さ(またはそれ以上)に到達するのがどれほど難しいかはわかりません。


削減はとてもクールです。この「植えられた密な部分グラフ」の推測を参照できますか?
Erel Segal-Halevi

予想は、cc.gatech.edu /〜klai9 / FinalThesis.pdf(予想2)、users.cs.duke.edu /〜rongge / derivatives_ics.pdf(最も密度の高いサブグラフの仮定)を含む、わずかに異なるフレーバーの下で何度も現れました、proceedings.mlr.press/v40/Hajek15.pdf(PC仮説)、math.ias.edu/files/ABW10_STOC.pdf(DUE仮定)、core.ac.uk/download/pdf/62922882.pdf(密部分グラフ植え推測)、とりわけ。最終的な結果は十分に類似しているため、上記の構成は、選択したフレーバーに適応させるためにほとんど変更を必要としません。
ヨナタンN

興味深い、ありがとう!質問に追加しました。最初のプレーヤーが少なくともスコアを獲得できる明示的な戦略です。したがって、は計算可能ですが、は計算可能ではありません(推測が真であると仮定した場合)。計算可能な最大のスコアはいくつですか?3 | T | / 8 | T | / 23|T|/83|T|/8|T|/2
Erel Segal-Halevi 2018年

頭から離れていませんが、週末にもっと考えられるかどうか見ていきます。すばらしい3/8の引数です!
ヨナタンN
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.