ナッシュ均衡は一般的に計算不可能です。 -Nash平衡は、内対戦相手の戦略、各プレーヤーの取得を与え、戦略の集合である可能な最大の期待利得の。ϵとゲームが与えられた場合、 -Nash均衡を見つけることはP P A D -completeです。
定義を厳密に言うと、与えられた -Nash均衡の戦略は、任意のNash均衡の戦略に近いと信じる特別な理由はないようです。ただし、「近似Nash平衡を計算する」という意味の場合、文献では「近似的にNash平衡を計算する」のような表現をだらしなく使用していることがよくあります。
ですから、2番目が1番目を意味するのはいつでしょうか。それは、ゲームは、我々が期待するかもしれないもののために、ある -Nash均衡はナッシュ均衡に「近い」ことを?
より正式には、人のプレーヤーでゲームを行い、一連の戦略プロファイル。
各は -Nash平衡であり、シーケンスはゼロに収束します。
私の質問:
いつ(どのような条件/仮定の下で)すべての戦略が収束しますか?すなわち、各選手のためであり、S (1 ) J、S (2 ) J、S (3 ) J、...収束必ずしも。
このシーケンスの制限は、実際にはどのような条件下でゲームのナッシュ均衡ですか?(それ以上の仮定は必要ないように思えます。つまり、すべての戦略が収束する場合、制限はNEになるはずです。)
ときに計算するアルゴリズムん -Nash均衡は必ずしもナッシュ均衡の約コンピューティング戦略のためのアルゴリズムを暗示しますか?上記の条件で十分ですか?
どうもありがとう!
2014-03-19を編集
ラーフルの答えに参照を読んだ後、の観点から考えるために、より合理的なようだディストリビューションではなく、収束の配列の間の距離。だから私は質問を言い換えてみて、最近の考えもいくつか載せます。
(まあ、これは本当に答えを持っているために、あまりにもアルゴリズムに依存している。アルゴリズムの制限がなければ、あなたは、2つの異なるナッシュ均衡とを持つことができ、あなたはますます小さくプラグインとしてアルゴリズムに、ℓ 1の連続出力間の距離出力は平衡間で振動するため、依然として大きくなる可能性があります。)
が戦略プロファイル、つまりプレーヤーの戦略に対する製品分布であると仮定します。ゲームは、我々はそれを言うことができるものについては、pがあるε -Nash平衡意味‖ pは- Q ‖ 1 ≤ δいくつかのナッシュ均衡のための、どこのように?(ペイオフが制限されている場合、逆が成り立つことに注意してください。)δ → 0 ε → 0 1
「ゲーム」と呼ばれる複雑さの設定では、実際には、純粋な戦略(「アクション」)の数であるによってパラメーター化されたゲームのシーケンスであるため、これは実際にはトリッキーです。したがって、はであり、相対速度が重要です。以下は、答えが「すべてのゲーム」ではないことを示す簡単な反例です。減少するシーケンスを修正するとします。次に、各、アクションで2プレイヤーゲームを構築します。プレイヤーが最初のアクションをプレイすると、他のプレイヤーのプレイ内容に関係なく、ペイオフはます。プレーヤーが2番目のアクションをプレイすると、ペイアウトはのn → ∞ ε → 0 ε 1、ε 2、... ε nは nは1 1 - ε nは 0他のプレイヤーが何をプレイするかに関係なく; プレイヤーが他のアクションをプレイすると、他のプレイヤーのプレイ内容に関係なく、ペイオフはます。
したがって、各ゲームには -equilibrium(両方とも2番目のアクションをプレイ)があり、それはその唯一のNash平衡(両方とも最初のアクションをプレイ)から距離で最大限遠くにあります。ε N ℓ 1
したがって、2つの興味深いサブ質問があります。
- 固定ゲームと固定、「十分に小さい」、上記の条件が満たされるかどうか(すべての -equilibriaはNash平衡に近い)。ϵ ϵ
- おそらく本質的に同じ質問かもしれませんが、ペイオフの違いが定数によって制限されている場合に条件が成立するかどうか。
(2)と同じ質問ですが、アルゴリズムによって計算された実際の均衡に関連しています。おそらくアルゴリズム的/建設的な答えが得られるか、まったく得られないので、区別はあまり問題になりません。