タグ付けされた質問 「gt.game-theory」

コンピュータサイエンスとゲーム理論に関連する理論的な質問

2
有限状態部分情報ゲームの複雑さ
可能性のある結果がそれぞれ[-1,0、+ 1]の値を持つ[lose、draw、win]である、有限数の状態のみを持つ決定論的部分情報ゼロサムゲームを考えると、 そのような値 を近似する複雑さは何ですか 内で加算的にゲームを実行しますか?ϵϵ\epsilon 特に、私はそれを行うためのアルゴリズムを一切思いつきません。 この投稿の残りの部分は 、問題のより完全な説明を提供することに専念している ので 、この投稿の上部の質問が何を意味するかを既に理解できている場合 、この投稿の残りを読む理由はありません。 審判マシン状態を有する所与、指定された初期状態と、状態 そのスコア対である、状態そのスコア対はであり、次の形式の状態s 0 s a [ − 1 、+ 1 ] s b [ + 1 、− 1 ]{1,2,3,...,S}{1,2,3,...,S}\{1,2,3,...,S\}s0s0s_0sasas_a[−1,+1][−1,+1][-1,+1]sbsbs_b[+1,−1][+1,−1][+1,-1] [p1_info,p2_info,num_of_choices,player_to_move,next_state_table][p1_info,p2_info,num_of_choices,player_to_move,next_state_table][\mbox{p1_info,p2_info,num_of_choices,player_to_move,next_state_table}]ここで: player_to_move∈{1,2}player_to_move∈{1,2}\mbox{player_to_move} \in \{1,2\} next_state_tablenext_state_table\mbox{next_state_table}は、関数{1,2,3,...,num_of_choices}→{1,2,3,...,S}{1,2,3,...,num_of_choices}→{1,2,3,...,S}\{1,2,3,...,\mbox{num_of_choices}\} \to \{1,2,3,...,S\} p1_info,p2_info,num_of_choices≥1p1_info,p2_info,num_of_choices≥1\mbox{p1_info},\mbox{p2_info}, \mbox{num_of_choices} \geq 1 マシンがそのフォームの状態にあるとき: 送信 Player_1および送信 、Player_2にp1_infop1_info\mbox{p1_info}p2_infop2_info\mbox{p2_info} 指定されたプレーヤーにを送信し 、そのプレーヤーからの入力として要素を待機し、num_of_choicesnum_of_choices\mbox{num_of_choices}{1,2,3,...,num_of_choices}{1,2,3,...,num_of_choices}\{1,2,3,...,\mbox{num_of_choices}\} その後、示される状態に移行しますnext_state_tablenext_state_table\mbox{next_state_table} マシンが他の2つの状態またはいずれかに、sasas_asbsbs_b その状態のスコアペアを出力として停止します …

3
ゲームのシュールな数値の実装
コンウェイによる超現実的な数の非常に素晴らしい構造があります。これらは、実数と序数の両方を含む「数字」であり、完全に順序付けられ、フィールドのすべてのプロパティを持ちます(セットではなくクラスを形成します)。 たとえば、このPDFまたはWikipediaを参照してください。 それらは、いわゆる「ゲーム」にさらに一般化することができます。これは、もともと組み合わせゲームを研究するために導入されました。Conwayの当初の動機はGoのゲームを分析することでした。特にエンドゲームは「シュールなゲーム」でモデル化するのに特に適しています。 私の質問は、ゲームでのレベルを向上させるためにAI(コンピュータープレーヤー)にこのアプローチを実装した人がいるかどうか知っていますか?Goの場合は特に興味がありますが、他の場合も同様です。そうでない場合、障害またはそれが良いアイデアではない理由がありますか?

2
PLSの問題に対する局所的な最適値の数を数えるのはどれくらい難しいですか?
以下のための多項式ローカル検索の問題は、我々は、少なくとも一つの解(局所最適)が存在しなければならないことを知っています。しかし、さらに多くの解決策が存在する可能性がありますが、PLS完全問題の解決策の数を数えるのはどれくらい難しいでしょうか?私は特に決定問題に興味があります。このPLS完全問題のインスタンスには2つ以上の解決策がありますか 複雑さは、選択したPLS完全問題に依存しますか?そうだとすれば、私は([SY91]と[Rou10]で定義されているように)加重2SATに特に興味があります。2SATの満足できるソリューションの数を数えることは#P-completeですが、一見したところ、重み付けされた2SATのローカル最適と2SATのソリューションはそれほど共通していないようです。 また、PLSのいとこであるPPADの場合、[CS02]は、ナッシュ均衡の数を数えることが#P-hardであることを示しています。これは、混雑ゲームでの純粋戦略均衡の数を数えるような同様のPLS問題も難しいことを示唆しています。 参照資料 [CS02] Conitzer、V. and Sandholm、T.(2002)。ナッシュ均衡に関する複雑性の結果。IJCAI-03。CS / 0205074。 [Rou10] T.ラフガーデン。(2010)。計算の均衡:計算の複雑さの観点。経済理論、42:193-236。 [SY91] AAシェーファーとM.ヤンナカキス。(1991)。解決が難しい単純なローカル検索の問題。SIAM Journal on Computing、20(1):56-87。

5
アルゴリズムゲーム理論-非標準的な平衡概念?
私はアルゴリズムゲーム理論の研究を始めていますが、通常とられる平衡の概念はグラフの不動点の概念であるようです。しかし、人々はリミットサイクルなどの代替の平衡概念を見てきましたか?「タイトな」リミットサイクル、つまり非常に短いグラフのサイクルは、平衡の標準的な定義に「近い」ものと見なすことができると想像できます。 Google Scholarを掘り下げてみましたが、ほとんど役に立ちませんでした。

2
一般化された地理のグラフのファミリーはどれですか?
@Marzioが述べたように、次のゲームはGeneralized Geographyとして知られています。 グラフと開始頂点与えられると、ゲームは次のように定義されます。G=(V,E)G=(V,E)G=(V,E)v∈Vv∈Vv \in V 各ターン(2人のプレーヤーが交互に)で、プレーヤーは選択し、次のようになります。u∈N(v)u∈N(v)u\in N(v) vvvとそのすべてのエッジがから削除されます。GGG u→vu→vu\to v(つまり、は頂点になるように更新されます)。vvvuuu 「行き止まり」(つまり、出て行くエッジのない頂点)を選択せざるを得なかったプレイヤーは負けます。 多項式時間で最適な戦略を計算できるグラフファミリーはどれですか。 たとえば、がDAGである場合、プレーヤーに最適な戦略を簡単に計算できることが簡単にわかります。GGG

1
このゲームの複雑さは何ですか?
これは私の前の質問の一般化です。 してみましょう一部のOracleへの質問をすることができます多項式時間決定論マシンである。最初はは空ですが、これは以下で説明するゲームの後で変更できます。ましょういくつかの文字列です。MMMAAAAAAxxx 次のアリスとボブのゲームを考えてみましょう。最初、アリスとボブはそれぞれとドルを持っています。アリスはを望み、ボブは望んでい。mAmAm_AmBmBm_BMA(x)=1MA(x)=1M^A(x)=1MA(x)=0MA(x)=0M^A(x)=0 ゲームのすべてのステップで、プレーヤーは文字列を追加できます。これはドルかかります。ここで、は多項式時間の計算可能な関数です。また、プレイヤーは自分のステップを逃す可能性があります。yyyAAAf(y)f(y)f(y)f:{0,1}∗→Nf:{0,1}∗→Nf: \{0,1\}^* \to \mathbb{N} プレーが終了するのは、両方のプレーヤーがすべてのお金を費やした場合、または一部のプレーヤーが負けのポジション(現在の値で定義される)にあるときにステップを逃した場合です。MA(x)MA(x)M^A(x) 質問:与えられたため、この試合の勝者を定義する問題であり ありますM,f,x,mA,mBM,f,x,mA,mBM, f, x, m_A, m_B EXPSPACE-完全なタスク? は(に属して)多項式の長さの文字列のみを要求できるため、AliceまたはBobがさらに長い文字列を追加しても意味がないことに注意してください。したがって、この問題はEXPSPACEにあります。 MMMAAAAAA 前の質問では、すべての文字列を追加すると1ドルかかります(つまり、)。次に、Lance Fortnowが示したように、このゲームはEXPHに属し、場合はPSPACEにます。 AAAf≡1f≡1f \equiv 1mA=mBmA=mBm_A = m_B

1
このゲームはEXPSPACE完全ですか?
してみましょう一部のOracleへの質問をすることができます多項式時間決定論マシンである。最初はは空ですが、これは以下で説明するゲームの後で変更できます。ましょういくつかの文字列です。A A xMMMああAああAバツバツx 次のアリスとボブのゲームを考えてみましょう。最初、アリスとボブはそれぞれとドルを持っています。アリスはを望み、ボブはM A(x )= 0を望んでいます。m B M A(x )= 1メートルあメートルあm_AメートルBメートルBm_BMあ(x )= 1Mあ(バツ)=1M^A(x)=1Mあ(x )= 0Mあ(バツ)=0M^A(x)=0 ゲームのすべてのステップで、プレーヤーは 1つの文字列を追加できます。これには1ドルかかります。また、プレイヤーは自分のステップを逃す可能性があります。ああA プレーが終了するのは、両方のプレーヤーがすべてのお金を費やした場合、または一部のプレーヤーが負けの位置(現在の値で定義される)にあるときにステップを逃した場合です。Mあ(x )Mあ(バツ)M^A(x) 質問:与えられたこのゲームの勝者を定義する問題は、m BはM、x 、mあ、mBM、バツ、メートルあ、メートルBM, x, m_A, m_B EXPSPACE-完全なタスク? は(Aに属している場合は)多項式の長さの文字列のみを要求できるため、AliceまたはBobがAにさらに長い文字列を追加しても意味がないことに注意してください。したがって、この問題はEXPSPACEにあります。 MMMああAああA

1
停止ゲームの均衡
次の2プレーヤーゲームを考えてみましょう。 自然がランダムにプログラムを選ぶ 各プレイヤーは、自然の動きに応じて[0、無限]の数値を再生します プレーヤーの数の最小値を取り、プログラムをその数のステップ(最大)実行します(両方のプレーヤーが無限を選択した場合を除く) プログラムが停止した場合、最小数をプレイしたプレイヤーは1ポイントを獲得します。プログラムが停止しない場合、そのプレイヤーは1ポイントを失います。最小以外の数をプレイしたプレーヤーは0ポイントを獲得し、両方が無限をプレイした場合、両方のプレイヤーは0を獲得します。 (コーナーケースは、問題の精神を最もよく維持する方法で処理できます。たとえば、上部の半連続性が役立つ場合があります。) 質問:このゲームには計算可能なナッシュ均衡がありますか? 計算可能性の要件がない場合、各プレーヤーは、プログラムが停止する正確なステップ数(またはプログラムが停止しない場合は無限大)を再生するだけです。 停止問題に対して通常の対角化の引数を試すと、混合戦略に均衡が存在することがわかります。そのため、明らかなアプローチはすぐには機能しません。多分それを微調整するいくつかの方法がありますか? 一方、実際の閉じたフィールドの同等性は、計算可能なペイオフの有限ゲームが計算可能な均衡を持っていることを意味します。このゲームは有限ではありませんが、戦略スペースは閉じていて、ペイオフは計算可能であるため、同じトリックをグリックスバーグの定理などで適用できますか?問題は、計算可能性の要件がない場合、平衡は純粋な戦略にあるため、計算可能平衡の存在を使用して計算可能な平衡の存在を証明しようとする試みは、平衡が純粋から混合にダウングレードされる理由を説明する必要があります。 これは、人々が以前にこの正確な質問に対処したことがないかもしれないが、同じようなものを見たことがあるような問題のようです。あまりめくることができませんでしたが、精神的に何か知っている人がいたら教えてください! 動機:自己参照が計算可能性の主要なブロックであるという一般的な直感があります。つまり、計算できない問題が何らかの形で自己参照を埋め込むということです。このようなゲームが計算可能なナッシュ均衡を持っている場合、それはその直感の証拠を提供します。 更新:明確にするために、平衡は、計算可能な実数の意味で「計算可能」である必要があります。混合戦略分布を記述する確率は、任意の精度で計算可能でなければなりません。(特定の精度のカットオフを超える確率は有限であることに注意してください。)これは、均衡戦略の任意の近似近似からサンプリングできることも意味します。

3
ネットワーク分析のためのペア近似の改良
ネットワーク上の相互作用を検討する場合、ダイナミクスを分析的に計算することは通常非常に難しく、近似が使用されます。通常、平均フィールド近似ではネットワーク構造が完全に無視されるため、適切な近似になることはめったにありません。よく使われる近似はペア近似です。これは、隣接ノード間に固有の相関を考慮します(直感的には、エッジの平均フィールド近似の一種と考えることができます)。 Cayleyグラフを検討している場合、近似は正確であり、正規規則グラフを検討している場合は非常に優れています。実際には、平均次数kでランダムグラフがあり、kの周りに次数が密に分布している場合にも、これは適切な近似を提供します。残念ながら、関心のあるネットワークや相互作用の多くは、この種のグラフではうまくモデル化されていません。これらは通常、特定の(および高い)で、(例えば、スケールフリーネットワーク、等)は、非常に異なる次数分布のグラフによくモデル化された係数クラスタリング(詳細については、参照、または特定の平均最短経路の距離をアルバート・Barabasi 2001) 。kkkkkkkkk これらのタイプのネットワークでうまく機能するペア近似の改良点はありますか?または、利用可能な他の分析近似はありますか? ネットワーク上の相互作用の例 私はネットワーク上の相互作用によって私が意味することの例を挙げようと思いました。進化ゲーム理論からの比較的一般的な例を含めます。 各ノードは、エージェント(通常は単に戦略によって表される)と考えることができます。これは、エッジを持つ他の各エージェントとペアでいくつかの固定ゲームをプレイします。したがって、各ノードへの戦略の割り当てが指定されたネットワークは、各ノードに見返りをもたらします。次に、これらのペイオフとネットワーク構造を使用して、次の反復のノード間の戦略の分布を決定します(一般的な例は、各エージェントが最も高いペイオフのネイバーまたはこれの確率的バリアントをコピーすることです)。通常、私たちが関心を持つ質問は、各戦略のエージェントの数と、それが時間の経過とともにどのように変化するかを知ることです。多くの場合、安定した分布(これについて知りたい、または概算したい)を持っているか、リミットサイクルまたはさらにエキゾチックな野獣がいることがあります。 この種のモデルで平均場近似を行う場合、ネットワーク構造をあからさまに無視し、完全なグラフに対してのみ正確である動的としてget レプリケーター方程式を使用します。(Ohtsuki&Nowak 2006のように)ペア近似を使用すると、わずかに異なるダイナミクスが得られます(実際には、修正されたペイオフマトリックスを持つレプリケーターダイナミクスがあり、修正はグラフの次数と更新ステップの詳細に依存します)。これは、ランダムグラフのシミュレーションによく一致しますが、対象の他のネットワークには一致しません。 例のようなより物理的な場合:エージェントをスピンで置き換え、ペイオフマトリックスを相互作用ハミルトニアンと呼び、定期的なランダム測定を実行しながらシステムを冷却します。 注意事項および関連する質問 トリプル(ノードの4倍)での平均場近似のタイプを考慮する種類のペア近似の単純な一般化は扱いにくく、それでも非常に異なる次数分布や平均最短経路距離を考慮に入れていません。 アルゴリズム進化ゲーム理論のソース

3
検索エンジンマーケティングオークションでのキーワード選択の問題
まず第一に、cstheoryがこの質問にうまく適合しているかどうかはまだわからないので、群衆がそうではないと考えても私は気分を害することはありません... 検索エンジンマーケティングでは、いくつかの問題が興味深いです。公正な(そして収益性の高い)オークションメカニズムの設計と、制限された通貨リソースの下での最適な入札戦略の計算は、興味深い(そして十分に文書化された)問題の2つの例です。 もう1つの興味深い問題は、キーワードの選択の問題です。最も収益性の高いキーワードを選択する方法です(利用可能な金額やキーワードの「トピック」へのリンクがありません)。「収益性の高い」とは、最高の収益または最高の利益をもたらすことです。これらの問題は不確実性を扱います。キーワードのクリック率は不明であり、コンバージョン率も不明です。 この問題に関連する理論的な作業を知っていますか?

3
ナッシュ平衡計算のアルゴリズム。
私はこれを以前に尋ねられたことがあるかどうかフォーラムを検索しました。アルゴリズムゲーム理論が議論されている間、私はこの特定の問題に対処することを見つけることができませんでした。私は、有限のn人ゲームで近似(混合戦略)ナッシュ均衡を計算するための最もよく知られているアルゴリズムが何であるかを理解しようとしています。もちろん、このアルゴリズムはPPADです。アルゴリズムの完全な精度よりも速度/効率に関心があります。 ありがとう、フィリップ

1
秘書採用ゲーム
これは古典的な秘書問題の延長です。 採用ゲームでは、候補者セットがあり、各労働者の熟練度を注文します。C={c1,…,cN}C={c1、…、cN}\mathcal C=\{c_1,\ldots,c_N\} Wlogでは、が最も熟練していると想定し、c 2がそれに続きます。c1c1c_1c2c2c_2 候補者の面接の順序はランダムに一律に選ばれ、雇用主には(明らかに)不明です。 次に、2つの潜在的な雇用主を持つ市場があるとします。すべてのラウンドで、新しい候補者が両社の面接を行います(それらをと呼びます)。面接では、AとBの両方が、現在の面接対象者を含む過去のすべての候補者の部分的な順序付けを観察します。次に、企業は(独立して)今日の応募者を採用するかどうかを決定します。A,Bあ、BA,BAあABBB にとって残念なことに、それはAの申し出と金銭的に競合することができないので、両方が労働者への申し出を延長する場合、Aが優先されます。BBBAあAAあA また、秘書が署名すると、会社はそれ以上の候補者に面接することはできず、競合他社は署名に気づきます。 各会社の目標は、より優れた秘書を持つ会社が引き継ぐことができるはずであることが知られているため、(単一の会社が最高の秘書を見つけたいという古典的な問題とは対照的に)よりスキルの高い候補者を雇うことです。市場。 大企業としての最適な戦略は何ですか()?AあA 中小企業()はどうですか?BBB 両方の企業が均衡戦略をとる場合、がより良い労働者を獲得する確率はどれくらいですか?BBB 関連する作業、カライら。は、この問題の対称バージョンについて説明します。このバージョンでは、両社が候補者を引き付ける同じ力を持っています。 この設定では、単純な(対称)均衡は、秘書が残りの候補者よりも優れている可能性が少なくとも50%である場合に秘書を雇うことです。 これにより、設定はどのように変化しますか?

1
DO
ナッシュ均衡は一般的に計算不可能です。εϵ\epsilon -Nash平衡は、内対戦相手の戦略、各プレーヤーの取得を与え、戦略の集合であるεϵ\epsilon可能な最大の期待利得の。ϵとゲームが与えられた場合、εϵ\epsilon -Nash均衡を見つけることはP P A D -completeです。εϵ\epsilonP P A DPPAD\mathsf{PPAD} 定義を厳密に言うと、与えられたεϵ\epsilon -Nash均衡の戦略は、任意のNash均衡の戦略に近いと信じる特別な理由はないようです。ただし、「近似Nash平衡を計算する」という意味の場合、文献では「近似的にNash平衡を計算する」のような表現をだらしなく使用していることがよくあります。 ですから、2番目が1番目を意味するのはいつでしょうか。それは、ゲームは、我々が期待するかもしれないもののために、あるεϵ\epsilon -Nash均衡はナッシュ均衡に「近い」ことを? より正式には、んnn人のプレーヤーでゲームを行い、一連の戦略プロファイル(s(1 )1、… 、s(1 )ん)、(s(2 )1、… 、s(2 )ん)、(s(3 )1、… 、s(3 )ん)、…(s1(1),…,sn(1)),(s1(2),…,sn(2)),(s1(3),…,sn(3)),…(s_1^{(1)},\dots,s_n^{(1)}), (s_1^{(2)},\dots,s_n^{(2)}), (s_1^{(3)},\dots,s_n^{(3)}), \dots。 各(s(私)1、… 、s(私)ん)(s1(i),…,sn(i))(s_1^{(i)},\dots,s_n^{(i)})はε私ϵi\epsilon_i -Nash平衡であり、シーケンスε1、ϵ2、ϵ3、…ϵ1,ϵ2,ϵ3,…\epsilon_1,\epsilon_2,\epsilon_3,\dotsはゼロに収束します。 私の質問: いつ(どのような条件/仮定の下で)すべての戦略が収束しますか?すなわち、各選手のためであり、S (1 ) J、S (2 ) J、S (3 ) J、...収束必ずしも。jjjs(1 )j、s(2 )j、s(3 )j、…sj(1),sj(2),sj(3),…s_j^{(1)},s_j^{(2)},s_j^{(3)},\dots このシーケンスの制限は、実際にはどのような条件下でゲームのナッシュ均衡ですか?(それ以上の仮定は必要ないように思えます。つまり、すべての戦略が収束する場合、制限はNEになるはずです。) ときに計算するアルゴリズムん -Nash均衡は必ずしもナッシュ均衡の約コンピューティング戦略のためのアルゴリズムを暗示しますか?上記の条件で十分ですか?εϵ\epsilon どうもありがとう! 2014-03-19を編集 ラーフルの答えに参照を読んだ後、の観点から考えるために、より合理的なようだディストリビューションではなく、収束の配列の間の距離。だから私は質問を言い換えてみて、最近の考えもいくつか載せます。ℓ1ℓ1\ell_1 …

2
メカニズム設計証明の理解
私はこの論文のオークション理論に関する証明の技術的な詳細に苦労してきました:http : //users.eecs.northwestern.edu/~hartline/omd.pdf 具体的には、定理2.5:真実のメカニズムに必要かつ十分な条件。 さらに具体的には、6ページに示されている証明の順方向。真の値をとして定義し、一般的な、場合によっては偽の値(入札など)をb iとして定義して、著者はさらに2つの追加を仮定します。数量、z 1およびz 2。v私viv_ib私bib_iz1z1z_1z2z2z_2 次に彼は、、b i = z 2と規定し、これにより、以前の論文に基づいた不等式が得られます。 v私= z1vi=z1v_i = z_1b私= z2bi=z2b_i = z_2 彼はまた、、b i = z 1と規定しており、これにより、以前の論文に基づいて、類似しているが異なる不等式が得られます。 v私= z2vi=z2v_i = z_2b私= z1bi=z1b_i = z_1 わかりました。次に、1つの不等式をもう1つの不等式から差し引き、その後の代数に基づいて希望する結果を導き出します。私はその減算が正当化される理由がわかりません-彼はまったく異なる(実際には反対の)仮定に基づく2つの不等式を減算しているようです。 この基本的なアプローチは他にも見たことがあると思います(ShohamとLeyton-Brownの本ですか?確認するために手元にありません)。これは一般的な考えのようですが、それを乗り越えられません。それが有効である理由を理解したり、欠けているものを説明したりできる人はいますか? (私は3つの値、つまり真の値と2つの入札値b 1とb 2を想定して目的の結果を証明しようとしましたが、彼の目的の結果が得られませんでしたが、失敗もしました。しかし、必要に応じては、作者の道にそれをすることができません。しかし、私はまだそれを理解していません。)viviv_ib1b1b_1b2b2b_2 更新:ShohamとLeyton-Brownの本で 似たようなものを見たことがあります。まったく同じではありませんが、非常に似ており、同じ方程式と主題を扱います。定理10.4.3のケース1です。 真実のメカニズムの文脈から始めて、彼らが最初に真実を前提とと偽vが「私がとに基づいて支払いすることを導き出すvが、私はより少ないですかに基づいて支払いに等しいV 「私は、例えば、Pは、I(V I)≤ P I(V " I)。そして、彼らは反対の、真実を前提とV 「私と偽V 私の支払いはに基づいていること、および反対の結果を導き出すV " Iviviv_iv′ivi′v_i'viviv_iv′ivi′v_i'Pi(vi)≤Pi(v′i)Pi(vi)≤Pi(vi′)P_i(v_i) …

1
カードゲームの勝者の簡易版
私はこの問題をMathOverflowで質問しましたが、満足のいく答えはありませんでした。 Winnerと呼ばれるカードゲームを簡略化した次の2人用ゲームを考えてみましょう。(次の定式化は、MathOverflowに関するGuillaume Brunerieのコメントから引用されました。) AとBの2人のプレーヤーがいます。各プレーヤーにはカードのセット(サブセット)があり、両方のプレーヤーから見ることができます。ゲームの目的は、自分のカードを取り除くことです。最初のプレイヤーはテーブル上のカードをプレイし、次に他のプレイヤーは(厳密に)より大きなカードをプレイする必要があります。その後、テーブル上のカードは捨てられ、他のプレイヤーは再び任意のカードをプレイすることから始めます(その後に大きなカードが続きます)。そして、2人のプレイヤーのうちの1人がカードを使い果たしてゲームに勝つまで続きます。{1,…,n}{1,…,n}\{1,\dots,n\} プレイヤーにとって最高の戦略を知りたい(彼が勝てる場合)。 正式な定義 示す最初のプレーヤのカードのセットがあるゲームの構成、第二のプレーヤーのカードのセットである、及びテーブル上の最大のカードである、テーブルにカードがないことを意味します。最初のプレーヤーが構成勝利戦略を持っているかどうかを指定して、アルゴリズムに指定して計算したいと思います。w(i,A,B)w(i,A,B)w(i,A,B)AAABBBiiii=0i=0i=0i,A,Bi,A,Bi,A,Bw(i,A,B)w(i,A,B)w(i,A,B) 正式には、次のように定義された関数を計算するアルゴリズムが必要です。fff ましょう、。Zn={1,2,⋯,n}Zn={1,2,⋯,n}\mathbb{Z}_n = \left\{1, 2, \cdots, n\right\}Bool={False,True}Bool={False,True}\mathrm{Bool} = \left\{\mathrm{False}, \mathrm{True}\right\} 関数f:{0,1,⋯,n}×2Zn×2Zn→Boolf:{0,1,⋯,n}×2Zn×2Zn→Boolf:\;\left\{ 0, 1, \cdots, n \right\} \times 2^{\mathbb{Z}_n} \times 2^{\mathbb{Z}_n} \to \mathrm{Bool} where f(i,A,B)=⎧⎩⎨⎪⎪⎪⎪FalseTrueTrueFalseB=∅B≠∅∧∃j∈A:j>i,f(j,B,A−{j})=FalseB≠∅∧f(0,B,A)=Falseotherwisef(i,A,B)={FalseB=∅TrueB≠∅∧∃j∈A:j>i,f(j,B,A−{j})=FalseTrueB≠∅∧f(0,B,A)=FalseFalseotherwise f ( i, A, B ) = \begin{cases} \mathrm{False} & B = \emptyset \\ \mathrm{True} & B \ne \emptyset …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.