有限状態部分情報ゲームの複雑さ


12


可能性のある結果がそれぞれ[-1,0、+ 1]の値を持つ[lose、draw、win]である、有限数の状態のみを持つ決定論的部分情報ゼロサムゲームを考えると、 そのような値
を近似する複雑さは何ですか 内で加算的にゲームを実行しますか?ϵ

特に、私はそれを行うためのアルゴリズムを一切思いつきません
この投稿の残りの部分は
、問題のより完全な説明を提供することに専念している ので
、この投稿の上部の質問が何を意味するかを既に理解できている場合 、この投稿の残りを読む理由はありません。

審判マシン状態を有する所与、指定された初期状態と、状態 そのスコア対である、状態そのスコア対はであり、次の形式の状態s 0 s a [ 1 + 1 ] s b [ + 1 1 ]{1,2,3,...,S}s0sa[1,+1]sb[+1,1]

[p1_info,p2_info,num_of_choices,player_to_move,next_state_table]ここで:

  • player_to_move{1,2}
  • next_state_tableは、関数{1,2,3,...,num_of_choices}{1,2,3,...,S}
  • p1_info,p2_info,num_of_choices1

マシンがそのフォームの状態にあるとき:

  • 送信 Player_1および送信 、Player_2にp1_infop2_info
  • 指定されたプレーヤーにを送信し 、そのプレーヤーからの入力として要素を待機し、num_of_choices{1,2,3,...,num_of_choices}
  • その後、示される状態に移行しますnext_state_table

マシンが他の2つの状態またはいずれかに、sasb

  • その状態のスコアペアを出力として停止します

自然の二人用のゲームがあります:審判のマシンは、状態で開始された、 プレイヤーが入力を提供する審判マシン待ちのため、もし審判マシン 停止し、その後、マシンの出力ペアのプレイヤー1得点最初の値とプレイヤー2 は、マシンの出力ペアの2番目の値を獲得します。それ以外の場合、両方のプレイヤーは0を獲得します。 s0=1





次の問題の複雑さは何ですか?
このようなレフェリーマシンと正の整数Nが与えられ
た場合、プレーヤー1の自然なゲームの値の1 / N以内に(加算的に)有理数を出力します 。

この質問で前述したように、それ
を行うためのアルゴリズムはまったく思いつきません。


プレイヤーは内部構造を知っていますか?追加情報を持っていることの利点は何ですか、それはより多くの可能な動きを与えますか?
-domotorp

はい。現在の状態が何であるかをよりよく理解できます。

申し訳ありませんが、まだ取得できません。その後、彼らは内部構造を知っていますが、彼らは現在どこにいるのかわかりませんか?説明を明確にしてください。問題を理解できないのは私だけではないはずです。
-domotorp

3
あなたのモデルは「部分情報を使用したゼロサムターンベースの確率的ゲーム」と同じですか?
クリストファーアーンスフェルトハンセン

1
@Kristoffer:私のモデルはそれ以外の場合と同等ですが、私のモデルが不合理な確率をコーディングできることは(少なくとも私には)明白ではありません。

回答:


6

注:私の意図したアルゴリズムは間違っていました。削除しました。

実現するべきことの1つは、ゲームが決定論的であるかどうかは問題ではないということです。ランダム化するために、レフリーは各プレーヤーに乱数modを提供するように依頼し、それらを追加できます。プレーヤーが最適な戦略を使用する場合、合計は乱数modであり、レフェリーが戦略をランダム化するために使用できることを示すのは簡単です。これにより、ゲーム内の状態の数が大幅に増えることはありません。Ppp

複雑さの下限については、単純な確率論的ゲームの値を近似する問題はPにあるはわかっていません。上記のランダム化のトリックを使用すると、多項式サイズのルックアップテーブルを使用して、単純な確率ゲームを参照ゲームとして簡単に記述できます。


そのランダム化のアイデアは(少なくとも、あなたが説明したように)合理的な確率のみを与えることができます。 また、リンクした最初の2つの論文で使用されている定義は、それらのゲームには有限のゲームツリーがあることを示しています。

あなたは正しい...私の答えの最初の部分は間違っています。削除させてください。単純な確率ゲームの価値を近似することは、すべてのコインフリップの確率が1/2であっても、Pにあることはわかっていません。
ピーターショー

1


ϵ0<ϵ

入力:質問に記載されているゲームは、次の
場合にYESを出力する必要があります:プレーヤー1のゲームの値が1より大きい場合-ϵ
ϵ

遺骨RE -hard場合でも、

player_to_moveは常に1であり(つまり、必要なプレイヤーは1人のみです)

s 0 ≠s aおよびs aはRange(next_state_table)にありません
(つまり、プレイヤーが失うことは文字通り不可能です)
および
p1_infoおよびp2_infoおよびnumber_of_choices状態に依存しない
(つまり、プレイヤーの唯一のフィードバックは、勝ったかどうかだけです)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.