有限状態部分情報ゲームの複雑さ
可能性のある結果がそれぞれ[-1,0、+ 1]の値を持つ[lose、draw、win]である、有限数の状態のみを持つ決定論的部分情報ゼロサムゲームを考えると、 そのような値 を近似する複雑さは何ですか 内で加算的にゲームを実行しますか?ϵϵ\epsilon 特に、私はそれを行うためのアルゴリズムを一切思いつきません。 この投稿の残りの部分は 、問題のより完全な説明を提供することに専念している ので 、この投稿の上部の質問が何を意味するかを既に理解できている場合 、この投稿の残りを読む理由はありません。 審判マシン状態を有する所与、指定された初期状態と、状態 そのスコア対である、状態そのスコア対はであり、次の形式の状態s 0 s a [ − 1 、+ 1 ] s b [ + 1 、− 1 ]{1,2,3,...,S}{1,2,3,...,S}\{1,2,3,...,S\}s0s0s_0sasas_a[−1,+1][−1,+1][-1,+1]sbsbs_b[+1,−1][+1,−1][+1,-1] [p1_info,p2_info,num_of_choices,player_to_move,next_state_table][p1_info,p2_info,num_of_choices,player_to_move,next_state_table][\mbox{p1_info,p2_info,num_of_choices,player_to_move,next_state_table}]ここで: player_to_move∈{1,2}player_to_move∈{1,2}\mbox{player_to_move} \in \{1,2\} next_state_tablenext_state_table\mbox{next_state_table}は、関数{1,2,3,...,num_of_choices}→{1,2,3,...,S}{1,2,3,...,num_of_choices}→{1,2,3,...,S}\{1,2,3,...,\mbox{num_of_choices}\} \to \{1,2,3,...,S\} p1_info,p2_info,num_of_choices≥1p1_info,p2_info,num_of_choices≥1\mbox{p1_info},\mbox{p2_info}, \mbox{num_of_choices} \geq 1 マシンがそのフォームの状態にあるとき: 送信 Player_1および送信 、Player_2にp1_infop1_info\mbox{p1_info}p2_infop2_info\mbox{p2_info} 指定されたプレーヤーにを送信し 、そのプレーヤーからの入力として要素を待機し、num_of_choicesnum_of_choices\mbox{num_of_choices}{1,2,3,...,num_of_choices}{1,2,3,...,num_of_choices}\{1,2,3,...,\mbox{num_of_choices}\} その後、示される状態に移行しますnext_state_tablenext_state_table\mbox{next_state_table} マシンが他の2つの状態またはいずれかに、sasas_asbsbs_b その状態のスコアペアを出力として停止します …